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(54) Verfahren zur Selbstsynchronisation von konfigurierbaren Elementen eines 
program mierbaren Bausteines 



(57) Die Erfindung betrifftein Verfahren zur Synchro- 
nisation der Datenverarbeitung zur Laufzeit konfigurier- 
barer, datsnverarfoeitender Elemente einer zur Laufzeit 
rekonfigurierbarenZeflarchitekturmitden Schritten, dass 
zumindest einige der Elemente konfiguriert werden, ein 
in einer Zelle erzeugtee Trigg ersignal zur Laufzeit zu ei- 



ner Anzahl korrfigurierter Elemente innerhalb der Zellar- 
chitektur ubertragen wird, das Triggersigna! von der An- 
zahl der Elemente empfangen wird und im Ansprechen 
auf den Triggerempfang anhand dessen die Ausfuhrung 
einer Konfiguration zur Datenverarbeitung bestimmt wird 
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Beschreibung 

1. Hintergrund der Erfindung 
5 1.1 Stand der Technik 

1.1.1 Problems 

[0001] Bei heutigen Bausteinen (FPGA, DPGA etc.) wird die Synchronisation der konfigurierbaren Elemente meistens 
10 durch den Takt des Bausteines hergestetlt. Diese Art der zeitlich gesteuerten Synchronisation bereitet viele Probleme, 
da oft nlcht im Vorhinein bekannt 1st, wis lange eine Aufgabe benotigt, bis ein guitlges Ergebnis bereit steht. Ein weiteres 
Problem der zeitgesteuerten Synchronisation 1st, daft das Ereignis auf welches die Synchronisation erfblgt nicht von 
dem zu synchronisierenden Element selbst ausgelost wird, sondern von einem unabhangigem Element. In diesem Fall 
sind nun zwei verschiedene Elemente an der Synchronisation beteiligt. Dies fuhrt zu einem erheblich hbhrem Verwal- 
15 tungsaufwand. 

Aus EP-A-0,726,532 jst ein Verfahren zur Steuerung des DatenfluSes in, aus mehreren als Array angeordneten Pro- 
zessoren bestehenden, SIMD-Maschlnen bekannt. Dabei wird eine Instruktlon an alls Prozessaren gesendet, die dy- 
namisch den Zielprozessor einer Datenubertragung auswahlt. Die Instruktion wird von einer ubergeordneten Instanz an 
alle Prozessoren (broadcast Instruction )gesendet und besteht aus einem Richtungsfeld (destination field) und einem 
20 Zielfeld (target field). Das Rlchtungsfeld steuert eine Elnhert Im Prozessorelement, urn dynamlsch das Nachbar-Prozes- 
sorelement zu ermitteln, zu dem das Ergebnis gesendet werden soil. Wit dem Zielfeld wird dynamisch das Operanden- 
register eines weiteren Prozesso re laments ausgewahlt, in welchem ein weiteres Ergebnis gespeichert werden soli. 

1 .1 .2 Verbesserung durch diB Erfindung 

25 

[0002] Durch die Erfindung wird ein Verfahren beschrieben, welches es gestattet, daft die Synchronisation von zu 
synchronisierenden Elementen selbst ausgehL Die Synchronisation ist nicht mehr durch eine zentrale Instanz imple- 
mentiert und wird auch nicht mehr durch eine zentrale Instanz verwaltet. Durch die Vertegung der Synchronisation in 
jedes Element k6nnen auch viel mehr Synch ronisatlonsaufgaben gleichzeitig durchgefilhrt werden, da unabhSmgige 
30 Elements sich nicht mehrgegenseitig beim Zugrrff auf die zentrale Synch ran isations-lnstanz behindern. Die Einzelheiten 
und besondere Ausgestaltungen, sowie Merkmale des erfindungsgemalien Synchronisationsverfahrens sind Gegen- 
stand der Patentanspruche. 

2. Beschreibung der Erfindung 

35 

'2.1 Llbersicht uber die Erfindung, Abstrakt 

[0003] In einem Baustein(DFP, DPGA) mitzwei- odermehrdimensional angeordneter, programmierbarerZellstruktur 
kann jedes konfigurierbare Element ubereine Vemetzungsstrukturauf die Konflgu rations- und Status register der anderen 
konfigurierbaren Elemente zugreifen und damit deren Funktion und Arbeitsweise aktiv beeinflussen. Eine Matrix aus 
derartigen Zeilen wird im Folgenden ProcessingArray (PA) genannt. Die Konfiguration kann somit zusatzlich zu der 
Qblichen Methode durch eine Ladelogik, aus dem ProcessingArray (PA) heraus erfolgen. 

2.2 Detailbeschreibung der Erfindung 

45 

[0004] Es wird von einem frei zur Laufzeit programmierbaren Baustein ausgegangen, welcher zusatzlich zur Lautzeit 
rekonfiguriert werden kann. Die auf dem Chip enthaltenen konfigurierbaren Elemente besitzen ein oder mehrere Kon- 
figurationsregister fur verschiedene Aufgaben. Auf diese Kanfigurationsregisterkann lesend wieschreibend zugegrlffen 
werden. In dem beschriebenen Verfahren wird davon ausgegangen, dalifurfolgende Informationen eine Konfiguration 
so in einem zu konfigurierenden Element eingestellt werden kann. 

- Vemetzungs-Register. In diesem Register wird die Art der Verbindung zu anderen Zeilen eingestellt 
Befehls-Register. In diesem Register wird die auszufQhrende Funktion des konfigurierbaren Elements eingetragen. 

- Status-Register. In diesem Register speichert die Zelle ihren aktuelten Zustand. Dieser Zustand gibt anderen Ele- 
55 menten des Bausteins Auskunft daruber, in welchem Verarbeitungszyklus sich die Zelle befmdet. 

Eine Zelle wird durch einen Befehl konfiguriert, welcher die Funktion der Zelle bestimmt, die ausgefuhrt werden soil. 
Weiterhin werden Konfigurationsdaten eingetragen urn die Vemetzung mit anderen Zeilen und den Inhalt des Status- 
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Registers einzustellen. Nach diesem Vorgang ist die Zeiie betriebsbereit. 

[0005] Urn eine flexible und dynamlsche Zusammenarbeit vieierZellen zu ermdglichen, kann jede Zelle auf alle Kon- 
figurationsregister einer anderen Zelle (esend oderschreibend zugreifen. Auf welches der vielen Konfigurationsregister 
Ie9end Oder schreibend zugegrrffen wird, wird durch die Art des Befehls, mit welchem die Zelle konfigurierl wurde, 
s festgelegt. Jeder Befehl den die Zelle ausfuhren kann, existiert in soviel verschiedenen Adressierungsarten, wie es 
verschiedene, voneinander unabhangige Konfigurationsregister, in einem zu konfigurierenden Element gibt. 
[0006] Beispiel: Eine Zelle besitzt die oben angegebenen Konfigurationsregister (Vernetzung, Befehl und Status) und 
soil den Befehl ADD, welcher eine Addition durchfuhrt ausfuhren. Durch die verschiedenen Arten des ADD Befehls kann 
nun selektiert werden, wohin das ergebnis dieser Funktion ubertragen wird. 

10 

ADD-A. Das Ergebnis wird an das Operand-Reg ister-A der Zieizelle Qbertragen. 
ADD-B. Das Ergebnis wird an das Operand-Reg ister-B der Zieizelle ubertragen. 
ADD-V. Das Ergebnis wird an das Vernetzungs-Register der Zieizelle ubertragen. 
ADD-S. Das Ergebnis wird an das Status-Register der Zieizelle ubertragen. 
15 ADD-C. Das Ergebnis wird an das Befehls- Register der Zieizelle ubertragen. 

2.2.1 Steuer- und Synchanisatlons Trigger 

[0007] Neben dem Ergebnis kann jede Zelle eine Menge an TriggerSignalen erzeugen. Die Trigger-Signale mussen 
20 nicht notwendigerWelsean die glelche Zieizelle Qbertragen werden, wledas Ergebnis der Verarbeitung des konfigurierten 
Befehles. Ein Trigger-Signal oder erst die Kombination mehrerer Trigger-Signale, ioBt bei der Zieizelle eine bestimmte 
Aktion aus oder setzt die Zelle in einen bestimrrrten Zustand. Eine Beschreibung derZustande ist waiter unten im Text 
zu finden. Folgende Trigger-Signale gibt es: 

25 . GO-Trlgger. Der GO-Trigger setzt die Zieizelle in den Zustand READY. 

- RECONFIG-Trlgger. Der RECONFIG-Trlgger setzt die Zieizelle in den Zustand RECONFIG, so daS die Zelle urn- 
program miert werden kann. Besonders in Zusammenarbeit mitSwitching-Tabellen ist dieser Trigger sehrsinnvoll. 
Geht man davon aus, daBzu verarbeitenden Daten mit der steigenden Taktflanke in die Operanden-Registergeladen 
werden, In der Zeitspanne des H-Level verarbeitet werden und mit der fallenden Flanke In das Ausgangsregister 

30 geschrieben werden, so ist eine Rekonfigurierung der Zelle mit der fallenden Flanke moglich. Mit der fallenden 

Flanke werden die neuen Konfigurationsdaten in das Befehls-Register geschrieben. Die Zeitspanne des L-Level ist 
ausreichend genug, um die Rekonfigurierung erfolgreich abzuschlieBen. 

- STEP-Trigger. Der STEP-Trigger loBt bei der Zieizelle, welche sich im Zustand WAIT befindet, die einmalige Aus- 
fuhrung des konfigurierten Befehls aus. 

35 . STOP-T rigger. Der STOP-T rigger halt die Zieizelle an, In dem die Zelle in den Zustand STOP gesetzt wird. 

[0008] Durch die Mdglichkeit in der verarbeitenden Zelle anzugeben, in welches Register der Zieizelle das Ergebnis 
eingetragen werden soil und welche Art von Trigger-Signal erzeugt werden sol), kann aus einem Datenstrom eine Menge 
an Verwaltungsdaten erzeugt werden. Diese Verwaltungsdaten stellen kein Ergebnis der eigentiichen Aufgabe dar, 
40 welche durch den Chip abgearbeitet werden soil, sondem dienen allein der Verwaitung, Synchronistion, Optimierung 
etc. des intemen Zustands. 

[0009] Jede Zelle kann folgende Zustande annehmen, welche durch eine geeignete Kodierung im Status-Register 
dargestellt werden. 

45 . READY. Die Zelle ist mit einem gultigen Befehl konfiguriert worden und kann Daten verarbeiten . Die Verarbeitung 
findet mit jedem Taktzykius statt. Die Daten werden auf Grund der Adressierungsart der datenschickenden Zelle in 
die Register der Zieizelle eingelesen. 

WAIT Die Zelle ist mit einem gultigen Befehl konfiguriert worden und kann Daten verarbeiten. Die Verarbeitung 
findet mit auf Grund eines Trigger-Signals statt, welches durch andere Elemente des Bausteins erzeugt werden 
so konnen. Die Daten werden auf Grund der Adressierungsart der datenschickenden Zelle in die Register der Zieizelle 
eingelesen. 

- CONFIG. Die Zelle ist nicht mit einem gultigen Befehl konfiguriert Das Datenpaket, welches mit dem nachsten 
Taktzykius an die Zelle gesandt wird, wird in das Befehls-Register eingelesen. Das Datenpaket wird auf Jeden Fall 
in das Befehls-Register eingelesen, egal welche Adressierungsart von der datenschickenden Zelle benutzt wurde. 

55 . CONFIG-WAIT. Die Zelle ist nicht mit einem gultigen Befehl konfiguriert. Ein Datenpaket, wird mit dem nachsten 
Trigger-Signal, welches durch andere Elemente des Bausteins erzeugt werden kann, eingelesen und in das Befehls- 
Register geschrieben. Das Datenpaket wird auf jeden Fall in das Befehls-Register eingelesen, egal welche Adres- 
sierungsart von der datenschickenden Zelle benutzt wurde. 
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RECONFIG. Die Zelle ist mit einem gultigen Befehl konfiguriert, verarbeitet aber keine weiteren Daten, nimmt die 
Daten auch nicht an. Die Zelle kann durch ein anderes Element des Baustelns urn konfiguriert werden. 
STOP. Die Zelle ist mit einem gultigen Befehl konfiguriert, verarbeitet aber momentan keine Daten. Die Daten 
werden von der Zelle angenommen (in die Eingangsregister ubertragen), aber nicht weiterverarbeitet. 

5 

[0010] Durch diese verschiedenen Zustande und der Moglichkeitaufdieverschiedene Register einer Zelle schreibend 
und lesend zuzugreifen, kann jede Zelle eine aktive Verwaltungsrolle einnehmen. Im Gegensatz dazu besitzen alle 
existierenden Baustelne dieser Art eine zentrale Verwaftungsinstanz, welche immer den gesamten Zustand des Bau- 
steins kennen und handhaben muli. 
10 [0011] Urn eine weitere FlexibiNtatzu erreichen gibteseine weitere Klasse an Befehlen, die nachderersten Ausfuhrung 
ihre Art wechseln. Bezogen auf des Beispiel des ADD-Befehls sieht ein Befehl dann so aus: 

- ADD-C-A. Das Ergebnis der ADD Funktion wird bei derersten Ausfuhrung des Befehls in das Befehls-Register der 
Zielzelle geschrieben. Bei jeder weiteren Ausfuhrung wird das Ergebnis in das Operand-Reg ister-A geschrieben. 

15 

[0012] Diese Moglichkeit kann beliebig erweitert werden, so dali auch Befehle der Art ADD-C-V-A-C-...-B denkbar 
sind. Jeder Befehl kann alle permutierten Kombinationen der verschiedenen Adresslerungs- und Trigger-Arten anneh- 
men. 

20 2.2.2 Rekonfigurationssteuerung mittels RECONFIG-Trigger. 

[0013] Im bisherigen Verfahren war es notwendig, da(i jedes zu konfigurierendes Element von einer externen Instanz 
einen RECONFIG-Trigger erhalten muBte, um in den Zustand 'rekonfigurierbar' uberzugehen. Dies hat den Nachteil, 
daft fur die Verteilung des RECONFIG-Triggers ein erheblicher Vemetzungsaufwand und Konflgu rations a ufwand erfor- 
25 derlich war. 

[0014] Durch die Strukutur der Vemetzung, kann dieser Nachteil beseitlgt werden. Alle konflgurierbaren Elemente, 
welche durch die Vernetzungsinformationzusammenhangen, stellen einen gerichteten Graphen dar. Ein soldier Graph 
kann mehrere Wurzeln(Quellen) und mehrere Blatter (Ziele) haben. Die konflgurierbaren Elemente werden so erweitert, 
daB sie einen eingehenden RECONFIG-Trigger entweder In Richtung inner ausgehenden Register, elngehenden Regi- 
30 ster, odereiner Kombinataion derer, propagieren. Durch diese Propagierung erhalten alle direkt mit dem konflgurierbaren 
Element verbundenen konflgurierbaren Elemente ebenfalls den RECONFIG-Trigger. 

[0015] Eine Konfiguration (Graph) kann nun komplett in den Zustand 'rekonfigurierbar' gebracht werden, in dem 
entweder an alle Wurzeln ein RECONFIG-Trigger geschickt wird und diese den RECONFIG-Trigger in Richtung der 
Ausgangsregister propagieren. Die Menge der Wurzeln in einem Graph, an die ein RECONFIG-Triggergeschickt werden 
35 muS, ist erhebllch Weiner, als die Menger aller Knoten des Graphen. Dadurch wird eine erhebliche Minlmlerung des 
Aufwandes erreicht. Selbstverstandlich kann ein RECONFIG-Trigger auch an alle Blatter geschickt werden. Der RE- 
CONFIG-Trigger wird in diesem Fall in Richtung der Eingangsregister propagiert. 

[0016] Durch den Einsatz beider Moglichkeiten Oder einer Mischung beider Verfahren, kann die minimale Menge an 
konfigurierbaren Elementen berech net werden, an die ein RECONFIG-Trigger he rangefuhrt werden muR. 

40 [0017] Die konflgurierbaren Elemente kannen einen Zusatz zu ihrem Status-Register bekommen, der angibt, ob ein 
eingehender RECONFIG-Trigger propagiert werden soil Oder nicht Diese Information wird dann benotigt, wenn zwei 
Oder mehr verschiedene Graphen an ein oder mehreren Stellen zusammen hangen (also einen Ubergang haben) und 
es nichtgewunscht ist, daB auch einer der and eren Graphen in den Zustand 'rekonfigurierbar' ubergeht. Ein Oder mehrere 
konfigurierbare Elemente verhalten sich also wte eine Schleuse. 

45 [0018] Weiterhin kann das Status-Register derail erweitert werden, daB ein zusatzlicher Eintrag angibt, in welche 
Richtung ein eingehender RECONFIG-Trigger weitergegeben werden soli. 

[0019] Das beschriebene Verfahren, kann auf alle Arten von Triggem und/oder Daten angewandt werden. Es kann 
dadurch eine automatische 

Verteilungshierarchie hergestellt werden, welche sehr wenige Zugriffsmoglichkeiten von auRen benotigt, um diese in 
50 Gangzu setzen. 

3. Implementierung mehrer Funktionen gleichzeitig in denselben konfigurierbaren Elementen 
3.1 Grundfunktion und benotigte Trigger 

55 

[0020] Eine besonders komplexe Variante des Aufrufes verschiedener Macros durch eine Bedingung wird im Folgen- 
den vorgestellt 
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Bei der Ausfuhrung einer Bedingung (IF COMP THEN A ELSE B; wobei COMP ein Vergleich darstellt, A und B 
auszufflhrendeOperationenslnd)weirden keine GO-undSTOP-T^ 

(TRIGV) generiert, der angibt, zu welchem Ergebnis der Vergleich COMP gefuhrt hat. Der Trig gervektorkann daher 
die Zustande "gleich", "groGer" Oder "kleiner" annehmen. 
5 Der Vektor wird an eine nachfolgende Zelle gesandt, die anhand des Zustandes des Vektors genau ein bestimmtes 

Konfigurationsregister{entspnechend AoderB) auseinerMehrzahl von Konfigu rations registem auswahlt. Dadurch 
wird erreicht, daft je nach Ergebnis des vorangegangenen Vergleiches eine andere Funktion uber die Daten durch- 
gefOhrt wird. 

Zustande wie "groRer-gleich", "kleiner-gleicrf, "gleichungleich" werden aufgelost. indem zwei Konfiguralionsregister 
10 mit denseiben Korrfigurationsdaten beschrieben werden. Beispielsweise wird bei "groRer-gleich" das Konfigu rati- 

onsregister "grfMJer" und das Konfigurationsreglster "gleich" mit demselben Konfigurationswort beschrieben, wSh- 
rend das Konfigurationsregister "kleiner" ein anderes Konfigurationswart enthait. 

[0021] Bei der Implementierung der Triggervektoren (TRIGV) ist keine Begrenzung auf die Zustande "grower", "kleiner" 
15 und "gleich" erforderlich. Zur Auswertung von grolien "CASE ... OP Konstrukten kann eine beliebige Zahl n, die den 
Zustand des CASE reprasentiert, als Triggervektor (TRIGV-m) zu deroder den nachfolgen Zellen we itergeleitet werden. 
Mit anderen Worten gibt n den Vergleich Innerhalb des CASE an, der bei Auswertung deranliegenden Daten zugetroffen 
hat. Zur Ausfuhrung der innerhalb des CASE dem Vergleich zugeordneten Funktion wird n an die ausfuhrenden Zellen 
weitergeleitet urn die entsprechende Funktion zu selektieren. Wahrend die Zellen im "groBer/Weiner/gleicrT-Fall minde- 
20 stens 3 Konfigurationsregister benotigen, muS bei der Verwendung von TRIGV-m die Artzahl der Konfigurationsregister 
mindestens genau dem maximalen Wert von n (max (n)) entsprechen. 

3.2 Propagieren der benotigten Funktion durch Trigger 

25 [0022] TRIGV/TRIGV-m werden an die erste, die Daten verarbeitende Zelle gesendet In dieser Zelle werden TRIGV/ 
TRIGV-M ausgewertet und die Daten entsprechend verarbeltet. Zusammen mit den Daten wird TRIGV/TRIGV-m an die 
nachfolgenden Zellen weitergeleitet (propagiert). Dabei erfolgt eine Weiterleitung an alle Zellen, die aufgrund der Aus- 
wertung (IF Oder CASE) eine bestimmte Funktion ausfuhren. Dabei ist die Weiterleitung direkt an die Weiterleitung der 
Datenpakete gekoppelt. d.h die Weiterleitung erfolgt synchron zu den Daten. Die zum Zeitpunkt t generierten TRIGV/ 

30 TRIGV-m, werden mit den zum Zeitpunkt t an den ersten verarbeitenden Zellen (CELLS1 p vgl. Fig. 5: 0502, 0505, 0507) 
anstehenden Daten verknupft. 

[0023] TRIG/TRIG-V werden so weitergeleitet, daS die Vektoren mit den Daten zum Zeitpunkt t+1 an den zweiten 
verarbeitenden Zellen anliegen und zum Zeitpunkt t+2 an den dritten verarbeitenden Zellen usw. bis zum Zeitpunkt t+m 
TRIG/TRIG-V und die Daten an den (m-1)-ten Zellen und gleichzeitig letzten Zellen, die von dem TRIG/TRIG-V auslo- 
35 sendem Vergleich (IF/CASE) abhSngig sind, anstehen. Eine Verknflpfung erfolgt kelnesfalls so, dall die zum Zeitpunkt 
t generierten TRIG/TRIG-V mit Daten verknupft werden, die zu einem Zeitpunkt t oW <t an CELLS 1 anlagen! 

3.3 Reagieren auf das Auftreten oder Nicht-Auftreten von Triggern 

40 [0024] Es ist in Sonderfallen erforderlich auf das Nicht-Vorhandensein eines Triggers zu reagieren, d.h. ein Trigger- 
zustand tritt auf, jedoch wird keine Anderung des Triggervektors ausgelost. Auch in diesem Fall kann eine sinnvolle und 
wichtige Information an die nachfolgenden Zellen ubertragen werden. Beispielsweise ist bei einem Vergleich auf "grd&er°, 
"kleiner", "gleich" das Triggersignal "gleich" nicht vorhanden und andert sich auch nicht, wenn vom Zustand "kleiner" 
zum Zustand "grafier" Obergegangen wird. Dennoch beinhaltet das Nicht-Vorhandensein von "gleich" eine Information, 

45 namlich "ungteich". 

Urn auf beide Zustinde Vorhanden" und "nicht vorhanden" reagieren zu kdnnen, wird ein Eintrag in das Konfigurati- 
onsregister der Zelte hinzugefugt, das angibt, auf welchen der Zustande reagiert werden soli. 
Zudem wird zum Triggervektor TRIGV, der die Zustande "gleich", "graRer" und "kleiner" reprasentiert, ein Signal TRI- 
GRDY hinzugefugt, der das Auftreten eines Triggers anzeigt. Dies ist notwendig, da der Zustand "nicht vorhanden" auf 
so einem der Vektoren keinen AufschtuR mehr uber das Vorhandensein eines Trigger an sich gibt 

TRIGRDY kann fur ein Handshaking-Protokoll zwischen dersendenen und empfangenden Zelle benutzt werden, indem 
die empfangende Zelle einen TRIGACK generlert, sobald sie die Triggervektoren ausgewertet hat. Erst nach Eintreffen 
des TRIGACK nimmt die sendende Zelle den Triggerzustand zurGck. 

Dabei wird anhand eines Eintrages in das Konfigurationsregisters festgelegt, ob bei Aussenden eines Triggervektors 
55 auf den Erhalt eines TRIGACK gewartet werden soli, Oder ob der Triggerkanal unsynchronisiert ablauft. 
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3.4 Einsatz in Mikroprozessoren 

[0025] In Mikroprozessoren neuester Architektur werden bedingte Sprunge nicht mehr nach dem bekannten Verfahren 
der Branch-Prediction, also der Vorhersage eines Sprunges ausgefuhrt. Die spekulative Vorhersage von Sprungen, die 

5 zur Leistungssteigerung von Prozessoreneingefuhrtwurde, berechnete Sprunge aufgrund vonspekuIativenAlgorithmen 
varaus und mu&te bei fehlerhaften Berechnungen die gesamte Prozessarpipeline neu laden, was zu erheblichen Lei- 
stungsverlusten fuhrte. Um diese Verluste zu eleminieren wurde das neue Predicate/NOP-Verfahren eingefuhrt. Dabei 
1st Jedem Befehl ein ein Bit breites Status-Flag zugeordnet, das anzeigt, ob der Befehl ausgefuhrt werden soil - oder 
nicht. Dabei kann eine beliebige Mengean Statusflags existieren. DieZuordnung von Befehlen zu Status-Flags geschieht 

10 durch einen Compiler wahrend der Ubersetzung des Codes. Die Status-Flags werden von den ihnen zugeordneten 
Vergleichsoperationen zur Ausfuhrungzeit verwaltet und zeigen das Ergebnis des jeweiligen Vergleiches an. 
[0026] Je nach Zustand des einem Befehl zugeordneten Status-Flag wir der Befehl dann vom Prazessor ausgefuhrt 
{sofern das Status-Flag "ausfiihren" anzeigt) Oder der Befehl wird nicht ausgefuhrt und durch einen NOP ersetzt {sofern 
das Status-Flag "nicht ausfuhren" anzeigt). Ein NOP steht fur "No operation", was bedeutet, daS der Prozessor in 

15 diesem Zyklus keine Operation ausfuhrt. Dadurch geht der Zyklus fur sinnvolle Operationen verloren. 
Zur Optimierung des Zyklusverlustes werden zwei Maglichkeiten vorgeschlagen: 

3.5.1 Mehrere Befehlsregister pro Recheneinheit 

20 [0027] Elne moderner Mikroprozessor besltzt mehrere relativ unabhangige Rechenwerke. 

Gemaft dem hier vorgestellten Trigg er-Prinzip konnen die einzelnen Recheneinheiten mit mehreren Befehlsregistern 
a usgestattet werden, wobei ein Befehlsregister eines Mikroprozessorrechenwerkes synonym fur ein Konfigurationsre- 
gister, gemaB ublichen FPGA, DFP, o.a. Bausteinen, stehl Die Auswahl des jeweilig aktiven Befehlsregisters erfolgt 

25 a) anhand von Triggervektoren, die anderen Rechenwerken anhand von Vengleichen generiert wurden. 

b) anhand von mehrbittlgen Status-Rags (Im folgenden Status-Vektoren genannt), die gernad dem heutigen Ver- 
fahren nach dem Stand der Technik, Vergleichsbefehien zugeordnet sind. 

3.5.2 Geanderter VLIW-Befehlssatz 

30 

[0028] Eine besondere Ausgestaltung bietet sich durch VLIW-Befehlssatze. So kann innerhalb eines Befehiswortes 
mehrere moglichen, von einem Vergleich abhangenden, Befehle zu einem Befehl zusammengefa&t werden. Ein VLIW- 
Wort beliebiger Breite wird in eine beliebige Menge an Befehlen (Codes) unterteilt. 

[0029] Jeder einzelne dieser Codes wird durch einen Triggervektor oder Status- Vektor referenziert. Das bedeutet, 
35 zur Laufzeit wird einer der vorhandenen Codes aus dem VLIW-Wort ausgewahlt und verarbeltet. 

[0030] In der Tabelle ist ein mogliches VLIW-Wort mit vier Codes abgebildet, auf das ein 2-bittiger Triggervektor oder 
ein 2-bittiges Statusflag referenziert: 



VLIW- 


CodeO 


Codel 


Code2 


Code3 


Befehls- 










wort : 











Zuordnung: 
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Trigger- 


00 


01 


10 


11 


vektor / 










Status-Flag 
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4. Erweiterung der Hardware gegenuber ublichen FPGAs und DFPs 

4.1 Zusatzliche Register 

$ [0031] Zu den in DFPs ublichen Konfigurationsregistern kommt ein Statusregister und ein Konfigurationsregister hinzu. 
Beide Register warden vom PLU-Bus angesteuert und haben Verbindung zur Zustandsmaschine derAblaufsteuerung 
derjeweiligen Zelle. 

4.2 Veranderung des PLU-Busses 

10 

[0032] In FPGAs und DFPs werden die konfigurierbaren Register M-/F-PLUREG ausschlieRlich flber den PLU-Bus, 
der die Verbindung zur Ladetogikdarstellt, verwaltet. Um die erfindungsgemaBe Funktion zu gewahrteisten muft nunmehr 
eine zusatzliche Zugriffsmdglichkeit durch den normalen Systembus zwischen den Zellen m&glich sein. Dasselbe gilt 
fur die neuen Status- und Konfigurationsregister. 
15 [0033] Dabei ist nur der Teil des Systembusses fur die Register relevant, der uber die BM-UNIT, also dem Interface 
zwischen den Systembusse und der PAE, mit der PAE vernetzt ist. 

Daherwlrd der Bus von der BM-UNIT an die Register weitergeleitet, wo vorgeschaltete Multiplexer ode rvorgeschaitete 
Tore die Umschaltung zwischen dem PLU-Bus und dem fur die PAE relevanten Systembus ubernehmen. 
Dabei sind die Multiplexer Oder Tore so geschaltet, daftsie immerdenfurdiePAE relevanten Systembus durchschalten, 
20 aufcer nach einem RDcksetzen des Baustelnes (RESET) oder wenn der RECONFIG-Trigger aktiv ist. 

4.3 Erweiterungen der konfigurierbaren Elements (PAEs) gegenuber ublichen FPGAs und DFPs 
4.3.1 Triggerquellen 

25 

[0034] Ein konfigurierbares Element kann Trigger von mehreren Quellen gleichzeitig empfangen. Durch diese M6g- 
lichkeit kann mit Hilfe von Maskierungs-Registern eine flexiblere Semantik der Trigger erreicht werden. 

4.32 Mehrere Konfigurationsregister 

30 

[0035] Anstatt eines Konfigu rations registers besitzt eine PAE mehrere (max(n)) Konfigurationsregister. 

4.3.3 Konfigurationsstatemachine und Multiplexer 

35 [0036] Den Konfigurationsregistern nachgeschaltet ist ein Multiplexer, der eine der mdgllchen Konfigurationen aus- 
wahlt. Die Steuerung des Multiplexers erfolgt durch eine separate Oder in die PAE-Statemachine integriert Statemachine, 
die den Multiplexer anhand eingehender Triggervektoren steuert. 

'4.3.4 Triggerauswertung und Konfiguration 

40 

[0037] Ein konfigurierbares Element kann ein Maskierungs-Register enthalten, in dem eingestellt werden kann, auf 
welchenTrigger-Eingangen, ein 

Trigger-Signal anliegen mud, so dali die Bedingungen fur eine Aktion des konfigurierbaren Elements, erfullt sind. Ein 
konfigurierbares Element reagiert nicht nur auf einen Trigger, sondem auf eine eingestellte KombinaUon aus Triggern. 
45 Weiterhin kann ein konfigurierbares Element eine Priorisierung gleichzeitig eingehender Trigger vomehmen. 

EingehendeTriggerwerden anhand desTRIGRDY-Signalserkannt. Dabei werden dieTriggervektorengemafizusatzlich 
in den Konfigurationsregistern vorhandenen Konfigurationsdaten ausgewertet. 

4.3.5 Triggerhandshake 

so 

[0038] Sobafd die Triggervektoren ausgewertet sind, wird ein TRIGACK zur Bestatigung des Triggervektors generierl 

4.3.6 BM-UNIT 

55 [0039] Die BM-Unit wird so erweitert, da& sie vom Bus kommende Trigger gemdft der Konfiguration im M-PLUREG 
an die SynoUnit und SM-Unit weiterreicht. Von der EALU generierte Trigger (z.B. Vergleicherwerte "groBer, "kleiner", 
"gleich", D-Detektoren, Vorzeichen, Ubertrage, Fehlerzustande (Division durch 0, etc.), etc.) werden gemali der Ver- 
schaltungsinformation im M-PLUREG von der BM-UNIT an den Bus weitergeleitet. 
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4.4 Erweiterungen des Systembusses 

[0040] Der Systembus, also das Bussystem zwischen den Zellen (PAEs), wird dahingehend erweitert, dafi zusammen 
mit den Daten die Informationen uber die Zielregister iibertragen werden. Das bedeulet, eine Adresse wird mitgeschickt, 
s die beim Datenemf anger das gewunschte Register selektiert. 

Ebenfalls wird der Systembus um die unabhangige Ubertragung von Triggervektoren und -handshakes erweitert. 

5. Kurzbeschreibung der Diagramme 
10 [0041] 

Fig. 1 zeigt, wie durch den Einsatz von Triggem ein Schlerfenkonstrukt implementiert werden kann. 
Fig. 2 zeigt, wie durch den Einsatz mehrerer Trigger ein Vergleichskonstrukt implementiert werden kann. 
Fig. 3 zeigt, wie durch den Einsatz mehrerer Trigger und deren Verschachtelung ein Vergleichskonstrukt mit meh- 
15 reren Ausgangen implementiert werden kann. 

Fig. 4 zeigt die notwendigen Erweiterungen gegenuber ublichen FPGAs und DFPs. 

Fig. 5 zeigt in einem Funktionsbeispiel die Auswahl verschtedener Funktionen der konfigurierbaren Elemente durch 
Trigger. 

Fig. 6 zeigt die Implementierung von mehreren durch Trigger angesteuerten Konfigurationsregistem zur Ausfuhrung 
20 verschledener Funktionen. 

Fig. 7 zeigt die Implementierung des Verfahrens aus Fig. 6 in Mikroprozessoren 

6. Detailbeschreibung der Diagramme und Ausfuhrungsbeispiele 
25 [0042] 

Figur 1 

Das Makro 0103 soli in diesem Beispiel 70 mal ausgefuhrt werden. Eine Ausfuhrung des Makros ben6tigt 26 Takt- 
zyklen. Das bedeutet, daH nur alle 26 Taktzyklen der Zahler 0101 um elns ve ring ert werden dart Ein Problem bei 

30 frei programmierbaren Bausteinen ist nun, dafi nicht immer garantiert werden kann, daft auch wirklich nach 26 

Takten die Abarbeitung des Makros 0103 abgeschlossen ist. Eine Verzogerung kann zum Beispiel dadurch entste- 
hen, daft ein Makro, welches die Eingangsdaten fur Makro 01 03 liefem soil, plotzlich 10 Taktzyklen langer bendtigt. 
Aus diesem GrundsendetdieZelle in Makro 01 03 ein Trigger Signal an den Zahler 01 01, durch welche das Ergebnis 
der Berechnung an ein weiteres Makro gesandt wird. Gleichzeitig wird die Verarbeitung des Makros 01 03 durch die 

35 glelche Zelle gestoppt. Diese Zelle "we Is' genau, dad die Bedingung fur die Beendlgung einer Berechnung erreicht 

wurde. 

Das gesendete Trigger-Signal ist in diesem Fall ein STEP-Trigger, welcherveranlaBt, daRderZahler0101 einmal 
seine konfigurierte Funktion ausfuhrt. Der Zahler zShltseinen Zahlerwert um eine herunter und vergleicht, ob er 
den Wert 0 erreicht hat Ist dies nicht der Fall, wird ein GO-Trigger an das Makro 0103 abgeschickt Dieses GO- 
40 Trigger-Signal veranlaBt das Makro 01 03 seine Funktion wieder aufzunehmen. 

Dieser Vorgang wiederholt sich solange, bis der Zahler 01 01 den Wert 0 erreicht hat In diesem Fall wird ein Trigger- 
Signal an das Makro 0102 geschickt und lolit dort eine Funktion aus. 

Durch dieses Zusammenspiel von Triggem kann eine sehr feingranulare Synchronisation erreicht werden. 
Figur 2 

45 Figur2entsprichtderGrundideeherFigur1. Die Funktion in Elemen 1 0202 ist diesesmaljedochkein Zahler sondem 

ein Vergleicher. Das Makro 0201 schickt nach jedem Verarbeitungsdurchlauf einen Verleichswert mit an den Ver- 
gleicher 0202. Je nach Ausgang des Vergleichs, werden wiederum verschiedene Trigger angesteuert um zum 
Beispiel eine Aktion in den Makros 0203 zu veranlassen. Das in Figur 2 implementierte Kanstrukt entspricht dem 
einer IF-Abfrage in einer Progammtersprache. 

50 Figur 3 

Wie in Figur 2 werden hiermehrere Vergleicher 0301, 0302 eingesetzt, umdie Konstruktion eines IF- ELSE-ELSE 
Konstruktes (Oder einer Mehrfachauswahl) zu implementieren. Durch die Verwendung verschiedentster Arten von 
Triggem und Verbindungen dieser Trigger zu den Makros 0303, 0304 kflnnen sehr komplexe Ablaufe einfach 
implementiert werden. 
55 Figur 4 

zeigt die Unterschiede zu ublichen FPGAs und DFPs. Das hinzugefugte Konfigurationsregister (0401) und das 
hinzugefflgte Statusregister(0402) haben uber den Bus (0407) Verbindung zur SM-UNIT. Die Register 0401 , 0402, 
F- und M-PLUREG sind uber einen intemen Bus 0206 mit einem Tor 0403 verbunden. Dieses verbindet den internen 
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Bus (0406) je nach Stellung mit dem PLU-Bus 0405 urn eine Konfiguration durch die PLU zu ermoglichen oder uber 
einen Bus 0408 mit dem BM-UNIT. Diese schaltet Je nach Adressierung auf dem Datenbus 0404 die Daten zu den 
O-REG weiter oder zu dem adressierten Register 0401, 0402, F- oder M-PLUREG. 

Die BM-UNIT (041 1) sendet uber 0415 Triggersignale an die SYNC-UNIT (0412). Von der EALU erhalt 041 1 uber 
0414 Ergebnisse ("gleich", "gra&er", "kleiner", "Ergebnis = 0", "Ergebnis positiv", "Ergebnis negativ", Uberlauf (positiv 
und negativ), etc.) urn diese in Triggervektoren umzuwandeln. Altemativ konnen von der SYNC-UN IT oder STATE- 
MACHINE generierte Zustande uber 0415 an die BM-UNIT ubermittelt werden. 

Die von der BM-UNIT an den Bus (0404) ubertragenen Triggersignale kdnnen je nach Konfiguration der auswer- 
tenden konfigurierbaren Elemente dort als STEP/STOP/GO-, RECONFIG-TriggeroderzurAuswahl einesKonfigu- 
rationsregisters verwendet werden. Welche Funktion ein generierter Trigger bei den auswertenden konfigurierbaren 
Elementen erftillt, wind durch die Vemetzung (0404) und die Konfiguration derjeweiligen konfigurierbaren Elemente 
bestimmt. Ein und derselbe Trigger kann bei verschiedenen konfigurierbaren Elementen unterschiedliche Funktion 
haben. 0416 istder Ergebnisausgang von R-REGsft zum Bussystem 0404 und den nachfolgenden konfigurierbaren 
Elementen. 
Figur 5 

In Figur 5 ist das zeitliche Verhalten zwischen generierten Triggem und den durch die Trigger selektierten Konfigu- 
rationsregistem beisplelsweise aufgezeigt. 0501 generiert durch einen Vergleich den TriggervektorTRIGV, der die 
Werte "equal" (gleich), "greater" (gro&er) oder "less" (kleiner) annehmen kann. Die konfigurierbaren Elemente 
0502-0504 verarbeiten Daten abhangig vom Vergleich (0501). Dabei ist die Verarbeitung von den Vergleichswerten 
"equal", "greater" und "less" abhangig. Die Verarbeitung fetgepipelinet, das heiRt, ein Datenwort wlrd nacheinander 
von 0502, dann von 0503 und zuletzt von 0504 modifiziert. 

0505 verarbeitet ebenfaiis Daten in Abhangigkeit von 0501. Dabei beschrankt sich die Abhangigkeit allerdings auf 
die Vergleichswerte "less", "greater" UND "equal" bewirken die gleiche Funktionsausfuhrung. Es werden also die 
Werte "kleiner" und "groBer Oder gleich" unterschieden. 0506 ist in der Pipeline 0505 nachgeschaltet. Dabei reagiert 

0506 auf "equal", "greater" und "less" unterschiedlich (vgl. 0503). 0507 ist ebenfaiis von 0501 abhangig, jedoch 
werden die Werte "gleich" und "ungleich (kleiner oder grfllier)" unterschieden. Das Ausfflhrungsbebpiel begin nt bei 
dem Zeitpunkt t (Fig. 5a) und endet am Zeitpunkt (t+3). Durchlaufen Daten eine der Pipelines (0502, 0503, 0504 
bzw. 0505, 0606) werden sie bei jeder Ausfuhrung in einer der Makros (0502-0506) urn einen Taktzyklus verzogert. 
Lingere und ins besondere unterschiedliche Verzdgerungen kbnnen ebenfaiis auflreten. Da zwischen den Daten 
undTrtggersignalen ein Handshakemechanismuszurautomatischen Synchronisation (gemaRdem Stand der Tech- 
nik, bzw. dieser Schrift (TRI GACK/TR IGRDY)) besteht, mud auf dissen Fall nicht gesondert eingegangen warden. 
Durch die Verzogerungen stehen zum Zeitpunkt t beispielsweise zwischen derzweiten und dritten Pipelinestufe die 
Daten und Triggersignale des fruheren Zeitpunktes t-2 an. Von Fig. 5a bis Fig 5d ist der Ablauf von 3 Taktzyklen (t 
bis t+2) dargestellt. 

[0043] Die von 0501 generierten Triggervektoren (also die Vergle ichserg ebnisse) sehen uber t betrachtet wie folgt aus: 



40 



45 



Zeitt 


Vergleichsergebnis 


t-2 


less, kleiner 


t-1 


greater, grofter 


t 


equal, gleich 


t+1 


greater, groRer 


t+2 


equal, gleich 
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[0044] In Figur 6 ist die Integration mehrerer Konfigu ratio nsregister-in ein konfiguHerfaares Element dargestellt. In 
diesem Ausfuhrungsbeispiel existieren drei Konfigu ratio nsregister (0409) nach Fig. 4. Diese werden Oberden Bus 0406 
konfiguriert. Uber das Bussystem 041 1 erhalt eine Steuereinheit (0601) (die auch als Statemachine ausgestaltet werden 
kann) die Signale TRIGV und TRIGRDY. DieSteuereinheitschaltetgemaBTRIGVeinesderKonfigurationsregisteruber 
den Multiplexer (0602) auf das Bussystem 0410, das zu den Steuermechanismen des konfigurierbaren Elementes fuhrt. 
Zur Synchronisation der Triggersignale mit den inlemen AblSufen des konfigurierbaren Elementes besitzt0601 einen 
Synchronisationsausgang, der an die Synchronisationseinheit (0412) oder die Statemachine (0413) fuhrt. Zur Synchro- 
nisation der Triggerquellen generiert 0601 das Handshakesignal TRIGACK nach Verarbeitung des eingegangenen 
Triggers. 

[0045] IndBm Ausfflhrungsbeispiel ist jedes der Konfigu rationsreglster (0409) einem TRIGV vom Typ ("equal", "grea- 
ter", less") zugeordnet. Werden bei jedem der Triggertypen andere Operationen ausgefflhrt, so ist jedes der Korrfigu- 
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rationsregister unterschiedlich belegt Wird beisptelsweise nur aus "equal" und "not equal" unterschieden, sind die 
Konfigurationsregister fflr die Typen "less" und "greater" gleich belegt, namiich mit der Konfiguratlan fflr "not equal". Das 
Korrfigurationsregister fur "equal" besitzt eine andere Betegung. Das bedeutet, anhand der Belegung der Konfigurati- 
onsregister kann der Verglelch genauer spezrfiziert werden, wobei jedes konfigurierbare Element diese Spezifizierung 
5 unterschiedlich gestalten kann. Uber das Register 0603 wird TRIGVzusammen mit dem Ergebnis an die nachfblgenden 
kanfigurierbaren Elemente weitergelertet urn ein Pipelining gem. Fig. 5a-d zu ermoglichen. Das Register und die Hand- 
shakesignale werden von 0412 oder.0413 gesteuert. Die Trigge reformation kann zusammen mit dem Ergebnis aus 
dem R-REGsft oderzeitversetzt, also vordem Ergebnis, Ober das Interface 041 6 an die nachfolgenden konfigurlerbaren 
Elemente ubertragen werden. 

10 Eine zeitversetzte Gbertragung bletet den Vorteil, daft keine zusatzliche Zeit zum Elnstellen der Konfigurationsregister 
in den nachfolgenden konfigurierbaren Elementen erforderlich 1st, da die Einstellung bereits vor Erhalt der Daten (zeit- 
gleich mit dem Freigeben des Ergebnisses) erfalgL Ein entsprechendes Timing (bezogen auf bezogen auf DFP ubliche 
Ablaufe) istin Fig. 6adargestellt. Die Triggervektoren (0615) werden mitdersteigenden Flanke(0613) des Bausteintaktes 
(0614) generiert Mit derfallenden Flanke (0612) werden die Trigger in den konfigurierbaren Elementen ausgewertet. 

15 Die Daten iaufen phasenverschaben, d.h. sie werden bei 0612 freigegeben und mit 0613 eingeiesen. Wahrend 0610 
werden die Triggervektoren uber den Bus ubertragen und die Daten berechnet. Wahrend 0611 werden die Daten uber 
den Bus tibertragen und die Trigger berechnet, bzw. die Konfigurationsregister der konfigurierbaren Elemente gemaR 
den bei 0613 gespeicherten Daten ausgewahlt und die Konfiguration entsprechend eingestellL 
[0046] Figur7azeigtdie Verwaltung von Sprungen nach dem Predicate/NOP-Verfahren gemaBdem Stand derTech- 

20 nlk. Belm AusfOhren elnes Verglelcheswird ein Elntrag im Predicate-Register (0704) gesetzt. Dleser Eintrag wird wahrend 
derAusfuhrung von Befehlen abgefragt und legt fest, ob ein Befehl ausgefuhrt wird (der Befehl innerhaib der von dem 
bedingten Sprung angesprochenen Codesequenz liegt), oder durch einen NOP ersetzt wird (der Befehl liegt in einer 
anderen als der durch den bedingten Sprung angesprochenen Codesequenz). Der Befehl steht dabei in dem Befehls- 
register 0701. Das Predicate-Register enthalt eine Mehrzahl von Eintragen, die einer Mehrzahl von Operationen und/ 

25 oder einer Mehrzahl von Rechenwerken zugeordnet sind. Diese Zuordnung wird zur Compile-Zeit des Programmes 
vom Compiler vergeben. Die Zuordnungsinformation (0707) wird dem Befehl, der in das Befehlsregister eingetragen 
wird zugeordnet, so daReineindeutiger Eintrag durch den jeweiligen Befehl referenziert wird. Durch0703wirdausgewahlt 
ob der Befehl aus 0701 oder ein NOP ausgefuhrt wird. Bei der Ausfuhrung eines NOPs geht ein Taktzykius verioren. 
0703 hat dabei symbolischen Charakter, da prinzipiell auch die Ausfuhrungseinheit (0702) direkt von 0704 angesteuert 

30 werden konnte. 

[0047] In Figur7b existieren n Befehlsregister (0701: Func 1 ... Func n). 

Bei derAusfuhrung eines Vergleiches/ bedingten Sprunges wird daszu adressierende Befehlsregister, also das Ergebnis 
des Vergleiches, als Eintrag (0708) in dem Predicate-Register 0706 abgetegt, wobei 0706 aus einer Mehrzahl solcher 
Eintrage besteht. Der jeweilige Eintrag (0708) in 0706 ist dabei so breit, daft alle moglichen Befehlsregister einer Aus- 

35 fflhrungselnhelt (0702) durch ihn adresslert werden kdnnen, das bedeutet, bei Befehlsreglstern ist die Eintrag sbreite 
log 2 (n). Das Predicate-Register enthalt eine Mehrzahl von Eintragen, die einer Mehrzahl von Operationen und/oder 
einer Mehrzahl von Rechenwerken zugeordnet sind. Diese Zuordnung wird zur Compile-Zeit des Programmes vom 
Compiler vergeben. Die Zuordnungsinformation (0707) wird der Menge an Befehlen, die in die Befehlsregister einge- 
tragen wird zugeordnet, so dad ein eindeutiger Eintrag durch die jeweilige Befehle referenziert wird. 

40 Ober den Multiplexer wird ausgewahlt, welches Befehlsregister den Code fur die momentane Ausfuhrung liefert. 

Durch diese Technik wird bei bedingten Sprungen auch im ungunstigsten Fall anstatt eines NOPs ein guttiger Befehl 
ausgefuhrt, wodurch kein Taktzykius verschwendet wird. 

[0048] Vorstehend beschrieben wurde somit unter anderem ein Verfahren zur Synchronisation sowohl der Ab- 
laufsteuerung der Datenverarbeitung In konfigurierbaren Elementen, als auch deren Umkonfigu ration, in Bausteinen mit 

45 zwei- oder mehrdimensionaler programmierbarer Zellstruktur (DFP, FPGA, DPGA, RAW-Machines), wobei ein kom> 
gurierbares Bussystem die Elemente miteinander verbindet, als auch der Ablaufsteuerung der Datenverarbeitung in 
ublichen, auf Rechenwerken aufgebauten Mikroprozessoren, Digitaien Signalprozessoren und Mikrokontrollern, durch 
bedingte Sprunge, wobei ein Bussystem die Rechenwerke miteinander verbindet, wobei vorgesehen ist, dad Syn- 
chronisationssignale wahrend der Vera rbeitung von den verarbeitenden konfigurierbaren Elementen durch Vergleiche 

so der Daten, Vorzeichen von Zahlen, Ubertrage von arithmetischen Operationen, Fehlerzustanden, u. dgl. (0202), generiert 
wer- . 

[0049] Operationen, Fehlerzustanden, u. dgl. (0202), generiert werden und an welter© Elemente (0201, 0203) Ober 
das Bussystem gesandt werden, wobei die empfangenden Elemente die Information zur Synchronisation der Daten- 
verarbeitung und Steuerung des Ablaufes der Datenverarbeitung verwenden (Fig. 1-3). 
55 [0050] Waiter ist in diesom Verfahren bevorzugt vorgesehen, daft bei der Synchronisation durch einen Trigger 
ein konfigurierbares Element oder Rechenwerk zur Ausfuhrung einer einzigen Operation angeregt werden kann (STEP- 
Trigger, Fig. 2). 

[0051] Auch ist in diesem Verfahren bevorzugt moglich, dad bei der Synchronisation durch einen Trigger ein 
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konfigurierbares Element Oder Rechenwerk zur Ausfuh rung ein er Vielzahl Operation angeregt werden kann (GO-T rigger, 

Fig. 2). 

[0052] Insbesondere ist auch als moglich vorgesehen, dafc bel der Synchronisation durch einen Trigger die Aus- 
fuhrung eines konfigurierbaren Elements Oder Rechenwerk angehalten werden kann (STOP-Trigger, Fig. 2). 
[0053] Es ist alternativ und/oder zusdtzlich moglich, dad bei der Synchronisation durch einen Trigger ein konfi- 
gurierbares Element zur Umkanfiguration freigegeben werden kann (Fig. 6). 

[0054] Weiter wurde vorstehend unter anderem auch ein Verfahren beschrieben, daft das konfigurierbare Element 
Oder Rechenwerk seinen mamentanen Status in einem Status register (0402) anzelgt. 

[0055] Weiterhin ist hierbei als Moglich keit vorgesehen, daft die Synchronisationssignale zum Empfanger der 
Daten, zum Sender der Daten oder zu einem unabhangigen konfigurierbaren Element oder Rechenwerk ubertragen 
werden (Fig. 1-3). 

[0056] Auch kann hierbei besonders bevorzugt vorgesehen sein, daft die Ubertragung der Synchronisationssh 
gnale gesperrt werden kann. 

[0057] Insbesondere ist hierbei als bevorzugt moglich, daB unterschiedliche Synchronisationssignale wahlweise 
ubertragen werden (Vergleich, Fehlerzustande, etc.), wobei die ArtdesSynchranistaionssignalesfrei in dergeneriBren- 
den Einhert wahlbar ist und die Auswirkung der Synchronisationssignale frei in der empfangenden Einheit wahlbar ist 
(Fig. 5). 

[0058] Weiter wurde hierbei als bevorzugt moglich vorgesehen, daft ein Synchronisationssignal an mehrere 
Empfanger ubertragen werden kann (0501). 

[0059] Weiterhi n ist h ierbei als I nsbeson dere bevorzugt mdgtich vo rgesehe n , d a ft el ne m Synch ra n isationssignal 
eine Quittierungsleitung zugeordnet ist (Fig. 6: TRIGACK). 

[0060] Weiter ist bei diesem Verfahren vorgesehen, dad ein Synchronisationsvektor aus einem odereiner Mehrzahl 
von Synchronisationssignalen aufgebaut ist (Fig. 6: TRIGV). 

[0061] Insbesondere ist hierbei als bevorzugt moglich, daS ein Konfigurationsregister aus einer Mehrzahl von 
Konfigurationsregistem durch einen Synchronisationsvektor ausgewahlt wird; bzw. ein Befehlsregister aus einer Mehr- 
zahl von Befehlsreglstem ausgewahlt wlrd (Fig. 7b). 

[0062] Weiter wurde hier als bevorzugt moglich vorgesehen, daft der Auswahlvorgang eines Registers durch 
Synchronisationssignale so mit der Datenverarbeitung synchronisiert wird, dad kein Takzyklus verlorengeht (Fig. 6). 
[0063] Weiterhin ist hierbei als insbesondere bevorzugt moglich vorgesehen, da& in einem einer Operation 
zugeordneten Register, ausgewahlt aus einer Mehrzahl an Registem, der Wert des generierten Synch ronisationssignals 
so gespeichert wird, daft eine andere zugeordnete Operation selektiv darauf zugreifen kann und anhand der Information 
einen moglichen und gultigen Befehl, bzw. eine mogliche und gultige Konfiguration, aus einer Mehrzahl von Befehlen/ 
Konfigurationen auswahlt 

[0064] Weiter wurde vorstehend unter anderem ein Verfahren zur Synchronisation sowohl der Ablaufsteuerung 
der Datenverarbeitung in konfigurierbaren Elementen, als auch deren Umkanfiguration, in Bausteinen mit zwei- oder 
mehrdimensionaler program mierbarer Zellstruktur (DFP, FPGA, DPGA, RAW-Ma chines), wobei ein konfigurierbares 
Bussystem die Elemente miteinander verbindet, als auch der Ablaufsteuerung der Datenverarbeitung in ubiichen, auf 
Rechenwerken aufgebauten Mikroprozessoren, Digitalen Signalprozessoren und Mikrokontrollern, durch bedingte 
Sprunge, wobei ein Bussystem die Rechsnwerke miteinander verbindet, wobei vorgesehen ist, dafi anhand entspre- 
chenderBefehle Ko nfigu rations wo rter in nerhalb eines konfigurierbaren Elementes oder Rechenwerkesgeneriert werden 
und uber den Datenbus zusammen mit der Adresse des anzusprechenden Registers an ein weiteres konfigurierbares 
Element oder Rechenwerk ubertragen werden, das die ubertragenen Konfigurationsworter in das adressierte Register 
schreibt (Seite 2-5). 

[0065] Es ist hierbei weiter als Mfiglichkeit vorgesehen, dafi das konfigurierbare Element oder Rechenwerk seinen 
momentanen Status in einem Statu sregister (0402) anzeigl 

[0066] Wetter wurde hierbei als bevorzugt mdglich vorgesehen, da& die Angabe der anzusteuernden Register 
in Befehlen kodiert ist und uber den Datenbus ubertragen wird (Seite 4, unten). 

[0067] Weiterhin ist hierbei insbesondere bevorzugt moglich, daft in einem einer Operation zugeordneten Regi- 
ster, ausgewahlt aus einer Mehrzahl an Registem, der Wert des generierten Synch ronisationssignals so gespeichert 
wird.daReineandere zugeordnete Operation selektiv darauf zugreifen kann und anhand der Information einen moglichen 
und gultigen Befehl, bzw. eine mogliche und gultige Konfiguration, aus einer Mehrzahl von Befehlen/Konfigurationen 
auswahlt. 

[0068] Weiterhin wurde vorstehend auch beschrieben, ein Verfahren zur Synchronisation sowohl der Ablaufsteue- 
rung der Datenverarbeitung in konfigurierbaren Elementen, als auch deren Urn konfiguration, in Bausteinen mit zwei- 
oder mehrdimensionaler programmierbarer Zellstruktur (DFP, FPGA, DPGA, RAW-Machines), wobei ein konfigurierba- 
res Bussystem die Elemente miteinander verbindet, sowie der Ablaufsteuerung der Datenverarbeitung in ubiichen, auf 
Rechenwerken aufgebauten Mikroprozessoren, Digitalen Signalprozessoren und Mikrokontrollern, durch bedingte 
Sprunge, wobei ein Bussystem die Rechenwerkemiteinanderverbindet, wobei vorgesehen ist, da&zurLaufzeit anhand 
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von Synchronisationssignalen eine giiltige Konfiguration der konfigurierbaren Elemente aus einer Mehrzahl an Konfi- 
gurationen oder ein gOltlger Befehl aus mehreren ein gilltlger Befehl aus mehreren mogllchen Befehlen eines Rechen- 
werkes ausgewahlt wird (Fig. 7b). 

[0069] Insbesondere ist hierbei als bevorzugt moglich, daB das konfigurierbare Element Oder Rechenwerkseinen 
momentanen Status in einem Statusregister (0402) anzeigt. 

[0070] Weiterwurdehierbeialsbevorzugtmoglich voigesehen, dali die Synch ra nisationssignale zum Empfanger 
der Daten, zum Sender der Daten oder zu einem unabhangigen konfigurierbaren Element oder Rechenwerk ubertragen 
werden (Fig. 1-3). 

[0071] Auch kann hierbei bevorzugt vorgesehen sein, dad die Clbertragung der Synchronisationssignale gesperrt 
werden kann. 

[0072] Weiter ist bei diesem Verfahren bevorzugt vorgesehen, daft unterschiedliche Synchronisationssignale 
wahlweise ubertragen werden (Vergleich, Fehlerzustande, etc.), wobei die Art des Synchronistaionssignalesfrei in der 
generierenden Einheit wahlbar ist und die Auswirkung der Synchronisationssignale frei in der empfangenden Einheit 
wahlbarist (Fig. 5). 

[0073] Auch ist es bei diesem Verfahren bevorzugt moglich, daft ein Synchronisationssignal an mehrere Emp- 
fanger ubertragen werden kann (0501 ). 

[0074] Insbesondere 1st auch alsmdglich vorgesehen, da fi einem Synchronisationssignal eineQuittierungsleitung 
zugeordnet ist (Fig. 6, TRIGACK). 

[0075] Weiterhin ist hierbei als Moglichkeit vorgesehen, daft ein Synchronisationsvektor aus einem Oder einer 
Mehrzahl von Synchronisationssignalen aufgebaut ist (Fig. 6, TRIGV). 

[0076] Insbesondere ist hierbei als bevorzugt moglich, daft der Auswahlvorgang Bines Registers durch Synchro- 
nisationssignale so mit der Datenverarbeitung synchronisiert wind, daft kein Takzyklus veriorengeht (Fig. 6). 
[0077] Weiter wurde hierbei als bevorzugt moglich vorgesehen, daR in einem einer Operation zugeordneten 
Reg ister, ausgewahlt aus einer Mehrzahlan Reg istem, der Wert des generierten Synch ronisationssignals so gespeichert 
wird , dad eine a n dene zugeordnete O pe ratio n se lektiv darauf zugreif en kan n u nd a nhand de r Information einen mogl ichen 
und gDltigen Befehl, bzw. eine mogliche und gflltige Konfiguration, aus einer Mehrzahl von Befehien/KonfiguratJonen 
auswahlt. 



Patentanspruche 

1 . Verfahren zur Synchronisation der Datenverarbeitung zur Laufzeit konfigurierbarer, datenverarbeitender Elemente 
einer zur Laufzeit rekonfigurierbaren Zellarchitektur mit den Schritten, dass zumindest einige der Elemente konfi- 
guriert werden, ein in einer Zelle erzeugtes Triggersignal zur Laufzeit zu einer Anzahi konfigurierter Elemente 
innerhalb der Zellarchitektur Obertragen wird, das Triggersignal von der Anzahi der Elemente empfangen wind und 
im Ansprechen auf den Triggerempfang anhand dessen die Ausfuhrung einer Konfiguration zur Datenverarbeitung 
bestimmt wird. 

2. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass die Konfiguration im Ansprechen 
auf den Triggereingang die Datenverarbeitung verzdgert, sofort und/oder mehrfach ausgefuhrt wird. 

3. Verfahren nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, dass zumindest einige der 
Elemente durch Einschreiben einer Mehrzahl von Konfigurationen in Konfigurationsregister vorkonfiguriert werden, 
ein in einer Zelle erzeugtes Triggersignal zu einer Anzahi vorkonfigurierter Elemente innerhalb der Zellarchitektur 
zur Laufzeit ubertragen wird, das Triggersignal von der Anzahi Elemente empfangen wird und anhand dessen eine 
gultige Konfiguration aus der Mehrzahl von in den Konfigurationsregistern vorab abgelegten Konfigurationen aus- 
gewahlt wird und Daten von zumindest einem vorkonfigurierten Element der Anzahi gemaS seiner aus der Vorkon- 
figuration ausgewahlten gultigen Konfiguration verarbeitet werden. 

4. Verfahren zur Synchronisation nach Anspruch 1 mit dem Schritt, dass ein Triggervektor erzeugt wird und ein trig- 
gervektorbezogenes Signal ubertragen wird, urn die Datenverarbeitung zu synchronisteren. 

5. Verfahren nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, dass das Triggersignal gem§B 
einer vorkonfigurierten Vemetzung ubertragen wird. 

6. Verfahren nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, dass sequenziell eine Rekorv 
ftguration von Elementen der Anzahi als eine Funktion des empfangenen Triggers ausgelost wird. 



12 



EP 1 669 885 A2 



Verfahren nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, dass Daten entlang eines vor- 
konflgurierten Weges prapaglert wenden, eln Trlggerslgnal entlang eines vorkonfigurlerten Weges propaglert wlrd 
und eine Rekonfiguration ausgelost wird als Funktion der Triggerprapagation. 

VerfahPBn nach einem der vorhergehenden Anspruche, worin die Datenverarbeitung im Ansprechen auf die Abwe- 
senheit eines Triggersignals erfolgt. 
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FPGA ARCHITECTURE HAVING RAM BLOCKS 
WITH PROGRAMMABLE WORD LENGTH AND WIDTH 
AND DEDICATED ADDRESS AND DATA LINES 

5 

RELATED PATENT APPLI CATIONS 

The present application relates to the following 
patent applications, all assigned to Xilinx, Inc, assignee 
of the above application, which are incorporated herein by 
10 reference: 

1. Pending U.S. application serial no. 08/222,138 
[M-2257-1N] entitled "Tile Based Architecture for FPGA" 
which was filed by Danesh Tavana, Wilson K. Yee, and 

15 Victor A. Holen on April 1, 1994 and which is incorporated 

herein by reference. 

2. U.S. Patent 5,517,135 [X-195] entitled "Bidirectional 
Tristate Buffer with Default Input" which was filed 

20 07-26-95 by Steven P. Young and issued 05-14-96. 

FIELD OF TH E INVENTION 

The invention relates to programmable logic devices 
formed in integrated circuits and more particularly to 
25 field programmable logic devices or field programmable 

gate arrays. 

BACKGROUND OF THE INVENTION 

A field programmable gate array (FPGA) comprises an 

30 array of programmable logic blocks which can be 

programmably interconnected to each other to provide a 
logic function desired by a user. U. S. Patent 4,870,302, 
reissued as U. S. Patent Re34,363 to Ross Freeman 
describes the first FPGA, and is incorporated herein by 

35 reference. Later patents such as U. S. Patents 4,758,745 

to Elgamal, and 5,243,238 to Kean and published 
application WO 93/05577 invented by Furtek and owned by 
Concurrent Logic, Inc. describe other FPGA architectures. 
These patents and application are also incorporated herein 

40 by reference. The Xilinx 1994 Data Book entitled "The 
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Programmable Logic Data Book", available from Xilinx, 
Inc., 2100 Logic Drive, San Jose, California 95124 
describes several FPGA products. As illustrated in the 
Xilinx data book, for example at page 2-114, FPGA products 
5 typically include a regular array of logic blocks, the 

number of which varies from one product to another. 

An FPGA architecture includes a programmable routing 
structure and an array of configurable logic blocks. The 
programmable routing matrix includes means for connecting 

10 logic blocks to each other. Thus an FPGA provides a 

combination of programmable logic and programmable 
connections to a general routing structure. 

In a typical FPGA application, the PIPs are turned on 
ahead of time by loading appropriate values into 

15 configuration memory cells associated with the PIPs, thus 

creating paths and establishing the logic performed by the 
configurable logic blocks. During operation, signals on 
the paths change dynamically as values are being written 
to and read from flip flops. 

20 Some users need blocks of random access memory (RAM) , 

for example so that complex functions generated in one 
part of the FPGA chip can be synchronized with complex 
logic generated in another part of the chip. For another 
example, users may want to provide a FIFO (first-in-first- 

25 out register) for buffering high speed data onto and off 

the chip, or to provide register banks for use by other 
logic in the chip. 

In conventional FPGA chips these blocks of RAM are 
generated by configuring programmable parts of the FPGA, 

30 thus making these parts of the FPGA unavailable for other 

uses. When a common function such as RAM is desired by 
many users, it becomes economical to dedicate a portion of 
the chip to this purpose, thus allowing the particular 
function to be implemented at high density and leaving 

35 other parts of the FPGA free for less predictable uses. 

The Altera FLEX 10K chip includes blocks of RAM that 
can be accessed by logic blocks in the chip. The Altera 
FLEX 10K structure is described briefly in a product 
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information bulletin from Altera Corp. dated January 1996 
and entitled "Benefits of Embedded RAM in FLEX 10K 
Devices". A block diagram on this publication shows a 
RAM/ROM block with several configurations. The RAM /ROM 
5 block is in an EAB (embedded array block) that includes 

input flip flops, a write pulse circuit, and input 
multiplexers for generating data, address, and write- 
enable signals from data, address, write enable, and input 
clock signals. The EAB also includes data-out flip flops 

10 and multiplexers for generating data-out signals. The 

Altera publication indicates that when large RAMs are 
desired, EABs are cascaded to implement larger RAMs. 

However, these dedicated RAM blocks are accessed 
through general interconnect lines, and using general 

15 interconnect lines to access RAM decreases the 

availability of general interconnect lines for routing 
other logic signals. 

SUMMARY OF THE INVENTION 

20 According to the present invention, blocks of random 

access memory, or RAM, integrated with FPGA configurable 
logic blocks include dedicated routing lines. General 
routing lines which access configurable logic blocks also 
access address, data, and control lines in the RAM blocks 

25 through the dedicated routing lines. Thus, the logic 

blocks of the FPGA can use these general and dedicated 
routing lines to access portions of RAM. These dedicated 
routing lines allow efficient connection of RAM blocks and 
arrays of RAM blocks whether the RAM blocks are configured 

30 long, wide, small, or large. Also, the dedicated routing 

lines allow logic blocks to conveniently access RAM blocks 
in a remote part of the chip. Access to the RAM blocks is 
efficient in any RAM configuration. Bidirectional buffers 
or pass devices segment the address and data lines at each 

35 RAM block so that a selectable number of RAM blocks can 

operate together as a RAM. 

In one embodiment of the invention, adjacent RAM 
blocks are joined through tristate bidirectional buffers. 
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These buffers include a default input such that the signal 
applied to one of the lines connected to the bidirectional 
buffer is always applied to the input terminal of a buffer 
element and applied by the output terminal of the buffer 
5 element to any load which may be connected to the buffer 

output terminal. Thus the buffer is never left floating, 
and the load connected to the output terminal of the 
buffer switches more quickly than if a signal had to flow 
through another pass transistor as with a symmetrical 

10 bidirectional buffer. In a preferred embodiment, the 

tristate bidirectional buffer with default input requires 
only four routing transistors plus the transistors which 
comprise the memory cells and the buffer element. 
Further, attaching a load to the output terminal of the 

15 buffer element may allow the direction control transistors 

to be smaller for the same switching speed than attaching 
the load directly to the line carrying the signal to be 
buffered. This buffer is further described in U.S. Patent 
5,517,135 [X-195]. 

20 According to yet another aspect of the invention, a 

decoder which enables dedicated RAM is configurable to 
respond in many different ways to decoder input signals. 
The decoder can be programmed to be enabled by any 
combination of decoder input signals and can be programmed 

25 to ignore any number of decoder input signals. The 

ability to ignore input signals is important in FPGAs 
because it saves having to route a disabling signal to an 
unused decoder input terminal. The decoder can also be 
programmed to be disabled regardless of decoder input 

30 signals. It can be programmed to treat a set of input 

signals as an address. It can invert or not invert the 
address . 

In one embodiment, data bus line segments in one RAM 
block are joined to line segments in another RAM block in 
35 a staggered or rotating fashion. For example, line 8 in 

one RAM block is joined to line 7 in the next RAM block. 
This means that several RAM blocks can be configured to be 
deep but not wide, so the RAM in one RAM block does not 
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use all its own data lines and adjacent RAM blocks can use 
some of the lines, and data in these adjacent RAM blocks 
can be conveniently accessed on data lines which do not 
contend . 

5 

BRIEF DESCRIPTION OF THE DRAWINGS 

Fig. 1A shows an FPGA chip which includes RAM blocks 
according to the present invention. 

Figs. IB and 1C illustrate two embodiments of RAM 
10 block 13 of Fig. 1A, showing external connections only. 

Fig. 2 shows the internal connections of the RAM 
block of Fig. IB, including a RAM. 

Figs. 3A-3D illustrate some of the symbols used in 
Figs. 2 and 7A. 

15 Figs. 4A and 4B illustrate bidirectional buffer 

symbols used in Figs. IB, 1C and 2, and a related 
bidirectional buffer usable with the present invention. 

Fig. 5 shows one embodiment of a decoder according to 
the present invention which may be used in the RAM block 
20 of Fig. 2. 

Figs. 6A-6C show four adjacent RAM blocks of the 
embodiment in Fig. 2, configured in three possible 
configurations to form RAMs of different word lengths. 

Fig. 7A shows the internal connections of the RAM 
25 block of Fig. 1C. 

Figs. 7B and 7C show enlargements of portions of Fig. 
7A near RAM 531. 

Figs . 8A-8C represent RAMs configured from four 
adjacent RAM blocks of the embodiment in Figs. 7A-7C. 

30 

DETAILED DESCRIPTION 

Fig. 1A shows an FPGA chip according to the present 
invention. In the center portion of the chip are a 
plurality of logic blocks 1, separated periodically by 
35 columns of RAM blocks 13 . Each RAM block spans the height 

of four logic blocks 1. (In another embodiment, a RAM 
block can span fewer or more logic blocks, and columns of 
RAM blocks need not extend the full height of the FPGA 
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chip.) Along the four edges of the chip are edge blocks 2 
which include input/output blocks. Also present on the 
chip are pads (not shown) for connecting to external pins 
of a package which holds the chip. The pads connect to 
5 edge blocks 2, and each edge block is connected to at 

least one logic block 1. Also present are RAM edge blocks 
4 which connect to RAM blocks 13 and corner blocks 5 which 
connect to edge blocks 2 and which typically provide 
certain global signals such as a global clock signal and 

10 boundary scan signals. Edge blocks 2, corner blocks 5, 

and logic blocks 1 are discussed in detail in application 
serial no. 08/222,138 [M-2257-1N] , incorporated herein by 
reference, and are not again described here. 

Group 101 of RAM blocks will be discussed later in 

15 connection with Figs. 6A-6C. 

Fig. IB shows a first embodiment of a RAM block 13 of 
Fig. 1A, and shows external signal lines or buses 
connected to RAM block 13. This RAM block includes 2304 
memory cells configured as a 256x9 RAM. RAM block 13 is 

20 the height of four logic blocks 1. Typically, a logic 

block 1 must access a RAM block 13 either above or below 
its own position. Extending into RAM block 13 are four 
sets of routing lines L0 through L3 from adjacent logic 
blocks, one set of lines associated with each row of 

25 adjacent logic blocks. To facilitate access to RAM blocks 

above or below these horizontal lines, dedicated vertical 
lines carry address and data signals to the RAM blocks. 
Address bus ADDR, data-in bus DIN, and data-out bus DOUT 
extend vertically through the RAM block and prograiranably 

30 connect to the next adjacent RAM block. Also, extending 

vertically into RAM block 13 are global and local clock 
lines GCLK and CLK, write enable line WE, and block enable 
line EN. Global clock line GCLK is permanently connected 
to RAM blocks throughout the chip and other lines are 

35 programmably connectable to the RAM block above. 

Fig. 1C shows a second embodiment of a RAM block 13 
of Fig. 1A. In Fig. 1C, no enable line EN is provided. 
Instead the routing of the data-in and data-out lines 
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makes an enable line unnecessary. Instead of a write 
enable line, the embodiment of Fig. 1C includes a write 
enable bus 33, in one embodiment 4 lines wide. In both 
Fig. IB and Fig. 1C, separate data-in and data-out buses 
5 are provided. 

In the Fig. IB embodiment, the data-out buses of 
several RAM blocks can be connected together, in which 
case the same lines receive data out signals from several 
RAM blocks . Contention is avoided by activating the 

10 enable signal for only one commonly connected RAM block at 

one time. In Fig. 1C, several RAM blocks can be connected 
together and contention is avoided by staggering or 
rotating the data line connections so that signals to or 
from the several RAM blocks do not appear on the same 

15 line. The RAM block of Fig. 1C includes 4096 memory cells 

which can have four different internal configurations 
4096x1, 2048x2, 1024x4, and 512x8, whereas the RAM block 
of Fig. IB has one internal configuration 256x9. Other 
configurations are possible. For efficiency, the width 

20 options in Fig. 3 should be powers of 2 whereas in Fig. 

IB, any width may be used. Detail of Fig. IB is discussed 
below in connection with Fig. 2. Detail of Fig. 1C is 
discussed below in connection with Figs. 7A-7C. 

25 First Embodiment, Fig. 2 

Fig. 2 shows in detail dual port RAM block 13 of Fig. 
IB. This RAM block includes a dual port RAM 131. A dual 
port RAM provides two independent sets of address, data, 
and control lines for accessing the same memory locations. 

30 A dual port RAM is useful when a user wants to read or 

write to two addresses in the same memory at the same 
time. For example, a FIFO which receives bursts of data 
from an external source and stores the data for internal 
processing makes good use of the dual ports, using one 

35 port for being written to from the external source and the 

other for being read by internal logic. 

In Fig. 2, as in Fig. IB, extending horizontally in 
dual port RAM block 13 are four sets of local interconnect 
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lines LO through L3 which connect to adjacent logic 
blocks. Extending vertically in dual port RAM block 13 
are the address, data, and control lines of the RAM block. 
Four global clock lines GCLK connect permanently to RAM 
blocks above and below the illustrated RAM block 13 . Two 
local clock lines LCLK connect programmably to RAM blocks 
above and below. Both clock lines GCLK and LCLK connect 
programmably to RAM 131. The programmable connections 
shown at the top edge of Fig. IB are represented by 
pentagon symbols to the left of RAM 131. The pentagon 
symbol is discussed below in connection with Fig. 4A. 
Write enable lines WEA and WEB and address enable buses 
ENB and ENA connect programmably to RAM blocks above and 
below as do address buses ADDRB and ADDRA. 

Many configurations of the FPGA are implemented more 
conveniently with separate data-in and data-out lines 
because an interconnect line must be driven from a single 
source, and if a RAM must have tristate control on all 
data output drivers, it may be difficult to route a signal 
for providing the tristate control to the RAM. Thus it is 
preferable for data-in and data-out signals not to share 
the same line. Therefore, dual port RAM block 13 includes 
both data-in buses DINB and DINA for writing to RAM 131 
and data out buses DOUTB and DOUTA for reading from RAM 
131. These data buses are connectable to RAMs above and 
below the one shown. In one embodiment the LCLK, WEA, 
WEB, ENA. and ENB lines and the ADDRA, ADDRB, DINA and 
DINB buses use buffered connections (represented by 
pentagons and discussed below) , and the DOUTA and DOUTB 
buses use unbuffered connections (represented by open 
circles) . 

Fig. 3A illustrates that the circle surrounding an 
intersection of two lines represents a pass transistor 
controlled by a memory cell M for connecting the two 
lines. Fig. 3B illustrates that the open circle joining 
two line segments also represents a pass transistor 
controlled by a memory cell for connecting the two line 
segments . 
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Fig. 3C illustrates that the triangle pointing in the 
direction of one line segment represents a programmable 
connection which applies a signal from the line at the 
flat edge of the triangle onto the line pointed to by the 
5 triangle. (The signal is of course then present on the 

full length of the line. A triangle pointing in the 
opposite direction would have the same meaning since it 
would point to the same wire.) Where signal flow is 
always in the same direction, the triangle symbol assists 
10 the reader with following the flow of signals. A simple 

pass transistor can make the connection, as shown in Fig. 
3C. 

When one line is accessed by several programmable 
connections, these are frequently implemented as a 

15 multiplexer. Fig. 3D shows four vertical lines VI through 

V4 that can each place a signal onto horizontal line H. 
Only one of these programmable connections is used at one 
time. As shown at the right of Fig. 3D, two memory cells 
Ml and M2 select which of vertical lines VI through V4 is 

20 connected through buffer B to horizontal line H. 

Bidirectional Buffer 

Fig. 4A illustrates that the pentagon between line 
segments A and B which is partly covered by line segment A 
is a bidirectional buffer, and illustrates another aspect 

25 of the buffer in which the bidirectional buffered 

connection between line segments includes a default input 
from line A to the buffer when the buffer is in a tristate 
mode . 

As shown in Fig. 4A, the bidirectional buffer 
30 includes one buffer element 41. Two memory cells Ml and 

M2 control the direction of signal flow and whether the 
buffer is in a tristate mode. When Ml and M2 both hold 
logical 0, the buffer is in a tristate mode, driving 
neither of line segments A or B. But P-channel transistor 
35 T43 is on, and therefore the signal on line segment A is 

applied to the input terminal of buffer 41. This buffer 
is further described by Young in U.S. Patent 5,517,135, 
incorporated herein by reference. 
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RAM Block 

Returning to Fig. 2, dual port RAM block 13 and 
connections to dual port RAM memory 131 will now be 
explained. Dual port RAM block 13 can be connected to the 
four rows of logic blocks in which RAM block 13 is 
positioned. Sets of local interconnect lines L0-L3 make 
programmable connections to logic blocks in the four 
respective rows spanned by RAM block 13. In addition, RAM 
131 can be connected to lines L0-L3 in RAM blocks above or 
below the one shown. 

Programmable connections such as shown by the 
pentagon symbol in Fig . 4A appear in Fig . 2 . As shown by 
the pentagons, each of the input signals to RAM 131 in 
Fig. 2 is buffered by a buffer element 41 (Fig. 4A) which 
is positioned at an intersection of horizontal and 
vertical lines in RAM block 13 (Fig. 2) . Thus the 
horizontal lines extending to the left edge of RAM 131 are 
buffered versions of the signals on vertical lines in Fig. 
2 to which the horizontal lines connect. Whether the 
source of a signal driving RAM 131 is above or below the 
horizontal line depends upon what value is in memory cell 
Ml (Fig. 4A) . Signals which drive input terminals to RAM 
131 can be derived from horizontal lines L0 through L3 or 
they can be derived from RAM blocks above or below the one 
shown in Fig . 2 . 

For example, in Fig. 2, in the row of logic blocks 
accessed by lines L3, line L3-0 can serve as a data-in 
line and be programmably connected to DINA bus line DIA2 . 
Alternatively, line L3-0 can serve as an address line and 
be programmably connected to ADDRB line ADDRB2 as 
indicated by the circle at the intersection of line L3-0 
with line ADDRB2. Line ADDRB2 is buffered by a 
bidirectional buffer to drive line ADB2. Programmable 
connections represented by pentagons are illustrated in 
Fig. 4A and discussed above. 

Similarly, line Ll-15 can serve as a local clock line 
driven by a logic block in the row accessed by lines LI 
and be programmably connected to local clock line LCLK1, 
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which is connected by a bidirectional buffer to line LCK1 . 
Line LCK1 can in turn be connected to clock input terminal 
CKB or CKA of either the B or the A port of RAM 131. 
Programmable connections represented by the triangles at 
the intersection of line LCK1 and the two clock input 
lines CKA and CKB to RAM 131 are illustrated in Fig. 3C 
and discussed above. 

Alternatively, line Ll-15 can serve as a data-out 
line and be programmably connected to DOUTB line DOB7. 

These and other programmable connections are 
indicated by circles, triangles and pentagons at the 
respective intersections. 

Pipulation 

The term PIP stands for programmable interconnection 
point. The term pipulation stands for PIP population. 
Many arrangements of pipulation are possible. Where it is 
desired to minimize chip area, fewer PIPs are provided 
(sparser pipulation) , and the locations of the PIPs are 
selected to provide the greatest flexibility and speed for 
common uses of the structure. If the PIPs are formed from 
very small devices such as EPROM cells or antifuses, PIPs 
may be provided at many intersections to increase 
flexibility. In general, pipulation must be sufficient 
and the number of local interconnect lines must be 
sufficient that a user can access all address, data, and 
control lines used in a configuration. In wide memories, 
since data lines are not shared, there must be an access 
point for each data track, as will be discussed in 
connection with Figs. 6A-6C. When data lines will be used 
by vertically adjacent RAM blocks, they can not be 
vertically connected, and sufficient pipulation must be 
provided to connect the vertical data lines to horizontal 
interconnect lines in the same RAM block. 

Decoder Blopfrs 

Decoder blocks 132 and 133 of Fig. 2 may be formed as 
shown in Fig. 5. In Fig. 5, decoder block 132 comprises 
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four two- input multiplexers MUXO - MUX3 . Each multiplexer 
is controlled by an enable line ENBO - ENB3 which can in 
turn be accessed from a line in two of the horizontal 
lines L0 through L3 . In the embodiment of Fig. 5, eight 
5 memory cells Ml - M8 provide the inputs to the four two- 

input multiplexers MUXO - M0X3 . (In another embodiment 
not shown, the eight multiplexer inputs are routed from 
neighboring logic blocks as are the four multiplexer 
control input signals shown in Fig. 2.) The decoder 
10 output signal ENB which controls RAM 131 (Fig. 2) is 

generated by NOR gate NORl (Fig. 5) in response to the 
output signals from the four multiplexers MUXO through 
MUX3 . 

Decoder blocks 132 and 133 allow enable lines in 

15 buses ENB and ENA to be used as additional address lines 

or to be ignored. These blocks can also be used to 
disable the entire RAM port. The arrangement of Fig. 5 
gives great freedom to the FPGA user. Regarding port B, 
the user can pair two vertically adjacent RAM blocks 13 

20 and use decoder 132 in each block to select between the 

two of them. Such an arrangement requires only one of the 
four input lines to decoder block 132. For example, in 
the two adjacent RAM blocks, multiplexers MUXl through 
MUX3 are caused to ignore their respective control signals 

25 by loading logical 0's into memory cells M3 through M8 . 

In one of the two RAM blocks, memory cells Ml and M2 are 
loaded with 01 and in the other, memory cells Ml and M2 
are loaded with 10. In this configuration, a logical 0 
applied to line ENBO selects the RAM block configured with 

30 01, and a logical 1 selects the RAM block configured with 

10. 

Placing 11 into any pair of multiplexer inputs, for 
example Ml and M2, causes NOR gate NORl to provide a 
logical 0 output signal and thus disables the B RAM block 
35 port. This allows the four enable lines to route signals 

to or from locations above or below the block shown. 

Placing 00 into any pair of multiplexer inputs causes 
that multiplexer to be a don't-care and causes decoder 132 
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to ignore the signal on the control input of that 
multiplexer. For example, placing 00 into memory cells Ml 
and M2 causes multiplexer MUXO to be a don't-care and 
allows line ENBO to be used for routing signals elsewhere 
5 while allowing decoder 132 to respond to other enable 

signals . 

In this situation, placing 01 01 01 into the three 
pairs of memory cells M3-M8 respectively causes decoder 
132 to be enabled in response to the address 000 on enable 

10 lines ENB1-ENB3. The values 01 in a pair cause the 

respective multiplexer to forward the control signal to 
the output. The values 10 in a pair cause the multiplexer 
to forward the complement of the control signal to the 
output. Eight RAM blocks 13 can be separately addressed 

15 by placing different permutations of 0 and 1 into the 

three pairs of multiplexer inputs in memory cells M3-M8 of 
the eight RAM blocks 13 and placing the address on lines 
ENB1-ENB3. And of course, sixteen RAM blocks can be 
addressed by using all four enable lines. 

20 A default value of 11 11 11 11 loaded into the eight 

memory cells M1-M8 disables the RAM so that no power is 
consumed and no contention occurs in response to any 
configuration of other parts of RAM block 13. 

Although Fig. 5 illustrates a NOR gate for generating 

25 the control output signal ENB, an OR, NAND or AND gate can 

be used just as well, with different values in memory 
cells M1-M8 achieving the desired result. For example, if 
an AND gate were used, the default value would be 00 00 00 
00. Different values on enable lines ENB1-ENB3 would also 

30 be used to produce the desired result. 

In one embodiment, a disabling decoder output signal 
(for example a logical 0 from NOR gate NOR1) also causes 
all output signals from that port (for example all signals 
from RAM 131 which drive DOUTB bus lines DOB0 - DOB8) to 

35 be tristated. This allows lines DOB0 - DOB8 to be driven 

by another RAM 131 above or below the one shown. However, 
tristating also makes it possible for lines DOB0 - DOB8 
(and other data out lines) to be left floating when no RAM 
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output signals are driving the lines. Thus small keeper 
circuits or pull-up resistors are attached to these lines. 

Fig, 4B 

5 if several copies of Fig. IB or Fig. 2 are placed 

vertically adjacent to each other, the lines or circles at 
the top of one copy will join straight lines at the bottom 
of another copy. Line B in the symbol of Fig. 4B is in 
the upper copy (or block) and line A and the circle in the 

10 symbol of Fig. 4B are in the lower copy. The combination 

of a triangle and an open circle with a line to its center 
shown at the left of Fig. 4B indicates a bidirectional 
buffer with default input shown at the right of Fig. 4B. 
This is the same circuit shown in Fig. 4A, and is not 

15 explained again. Part of the symbol of Fig. 4B appears in 

Figs. 6A-6C, discussed below. The symbol of Fig. 4B also 
appears in Figs. 7A-7C below. 

RAM Block Grouping and Mem ory Length/Width Control 

20 Fig. 6A illustrates a RAM block group 101 including 

four adjacent RAM blocks 13-5 through 13-8, each 
structured as shown in Fig. 2. Other numbers of RAM 
blocks can also be used together. RAM block group 101 is 
also illustrated in Fig. 1A. Each RAM block spans four 

25 logic blocks so the four RAM blocks in group 101 span 16 

logic blocks. The four adjacent blocks can be configured 
as a 1024x9 RAM, a 512x18 RAM, or a 256x36 RAM. Each 
RAM block includes a RAM 256x9, that is, a RAM having a 
depth of 256 words, each word having a width of 9 bits. 

30 The 9-bit word is used in this embodiment instead of an 8- 

bit word because many users want a parity bit, and getting 
a parity bit with only 8-bit words is awkward. Providing 
the 9th bit when unused is not so expensive since the 9th 
bit shares the decode logic of the other 8 bits and the 

35 12% increase in memory area produces a small increase in 

total area. In this embodiment, width (word length) and 
length (number of addresses) depend on how you turn on the 
bidirectional buffers and pass gates between adjacent RAM 
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blocks 13. Figs. 6B and 6C illustrate alternative 
configurations of RAM block group 101. 

In Fig. 6A, the four RAM blocks 13-5 through 13-8 are 
configured as a 1024x9 memory. For 1024x9, there must be 
10 address bits. The ADDR bus (buses ADDRA and ADDRB in 
Fig. 2) has 8 bits. As shown in Fig. 6A, the four 
adjacent ADDR buses in the four adjacent RAM blocks 13-5 
through 13-8 are connected together. The eight address 
bits in the ADDR bus (or 16 on dual address buses ADDRA 
and ADDRB of Fig. 2) address the 256 words (2 8 ) inside RAMs 
131. Since four locations, one in each RAM 131 are 
addressed by the same 8-bit address on BUS ADDR, two 
enable lines EN (EN A or ENB in Fig. 2) are also used as 
address bits and connected together to provide the 9th and 
10th address bits as discussed above in connection with 
Fig. 5. The data-in and data-out lines in one RAM block 
are connected to the corresponding data-in and data-out 
lines in the adjacent RAM blocks since only one RAM in the 
four RAM blocks will be addressed at any one time. The 
data placed onto the data-out line may be picked up at a 
local horizontal line at several places along the four RAM 
blocks (or 16 logic blocks) . The write enable WE and 
local clock LCLK lines are also connected together to 
group the four RAM blocks together. Black dots indicate 
buses having lines in adjacent blocks which have been 
connected through bidirectional buffers or pass gates, and 
clear circles indicate lines which have not been connected 
through bidirectional buffers or pass gates. Note at the 
top and bottom of Fig. 6A, the bidirectional buffers and 
pass gates show disconnected lines from the next RAM block 
above, whereas interior to the group of four, all pairs of 
lines in adjacent RAM blocks have been connected. 

As shown in Fig. 6B, to form a 512x18 memory, the 
data lines of the four RAM blocks are divided into two 
groups as indicated by the open circles PIN2 and P0UT2 
while the address, enable, write-enable, and local clock 
lines remain together. Only one of the enable lines is 
used as an address line, the others being ignored by the 
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don't-care configuration of the decoder discussed above in 
connection with Fig. 5. So two RAM cells, for example one 
RAM cell in RAM block 13-5 and one RAM cell in RAM block 
13-7, are accessed in response to one 9-bit address. For 
reading, the two addressed RAM cells each place their 9 
bits of data onto the data-out buses DOUT simultaneously. 
For writing, the two addressed RAM cells each take their 9 
bits of data from the data-in buses DIN simultaneously. 
The data-in and data-out lines are split at the middle at 
PIN2 and P0UT2 into two groups. Horizontal data lines in 
each of the upper and lower groups read and write data, 
and since the data lines are split there is no contention. 
The data bits stored in the upper two RAM blocks must be 
detected on horizontal lines connected to the upper. two 
RAM blocks 13-5 and 13-6 and the lower bits must be 
detected on the lower lines connected to RAM blocks 13-7 
and 13-8. In this example, addresses may come from logic 
block locations adjacent to any of the four RAM blocks or 
even from more distant locations which can be connected to 
the horizontal lines shown. In another example, bus ADDR 
in RAM block 13-5 may be connected to the address bus 
above (not shown) , in which case the address may be 
derived from logic blocks even farther from the addressed 
RAM blocks. Thus in response to one 9-bit address, 18 
data bits are written or read. 512 distinct locations are 
addressed by the 9-bit address, so the memory is 512x18. 

As shown in Fig. 6C, for a 256x36 memory, the data 
input and output lines of the four RAM blocks are 
separated into four groups while the address lines ADDR 
are connected together. In this configuration, only 8 
address lines are used. The enable lines are not used for 
addressing. Thus four RAM blocks place a data word onto a 
data-out bus or read a data word from a data-in bus in 
response to a single address. The four sets of data must 
then be detected or provided by logic blocks in the 
regions of the respective RAM blocks. 
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Dual port RAM Configurations 

Since each 256x9 RAM is a dual port RAM, it can be 
configured as two separate single-port 128x9 RAMs , or as 
one single-port 128x18 RAM. Recall that all 256 x 9 = 
5 2304 RAM bits are addressable from both address buses. 

To form two 128x9 RAMs, one of the eight address 
bits, for example the most significant address bit, is 
permanently set to one state on the address bus for one 
port and the other state for the other port. This causes 

10 half the RAM to. be addressed by the seven remaining bits 

on one address bus and half by the seven bits on the other 
address bus. The least significant seven address lines of 
one address port are connected to one set of seven 
vertical address lines and the least significant seven 

15 address lines of the other address port are connected to 

another set of seven vertical address lines. The data-in 
ports are connected to separate data-in lines and the 
data-out ports are connected to separate data-out lines. 
To form one single-port 128x18 RAM, the most 

20 significant bit in one address port is connected to the 

enabling voltage source, for example logical 1 and the 
most significant bit in the other address port is 
connected to ground. The remaining seven address lines 
from the two ports are connected to the same seven 

25 vertical address lines. Thus any address on the seven 

vertical address lines addresses two sets of RAM cells . 
The eighteen vertical data-out lines are connected to the 
eighteen data-out lines of the two ports and thus receive 
the contents of the two sets of addressed RAM cells, which 

30 then comprise a single 18-bit word. 

ggconfl Eflfroflj^em: , Fiqs. 7A-7Q 

A second embodiment of the RAM block of the invention 
is shown in Figs. 7A-7C. The RAM block of Fig. 7A 
35 includes RAM 531 and lines for connecting RAM 531 to other 

portions of the chip. RAM 531 is configurable to four 
different configurations: 4096x1, 2 048x2, 1024x4, and 
512x8. Horizontal lines extend left from RAM 531. These 
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provide address, data-in, and control signals to RAM 531. 
Horizontal lines extending to the right from RAM 531 
receive data-out signals from RAM 531. As in Fig. 2, 
dedicated vertical lines extending through the RAM block 
5 of Fig. 7A provide the interface between logic blocks of 

the FPGA chip and the RAMs 531 in the RAM blocks of the 
chip. As in Fig. 2, programmable connectors at the top of 
the figure allow the RAM block of Fig. 7A to connect to an 
identical RAM block above. The internal configurations of 
10 RAM 531 may be controlled in a manner similar to that 

discussed above in connection with Figs. 6A-6C, by well- 
known methods, or by the novel structure described by 
Nance et al. in co-pending application serial no. 
08/687,902 filed July 29, 1996 [X-264-1N] . 
15 As in Fig . 2, four groups of horizontal lines in sets 

L0 through L3 extend through the RAM block of Fig. 7A. 
These lines are part of the general interconnect structure 
for the logic blocks of the FPGA chip. Programmable 
connectors allow these horizontal lines to be connected to 
20 the vertically extending address, data-in, data-out, and 

control lines. In the embodiment of Fig. 7 A, longer 
horizontal lines HL0 through HL3 carry data-out signals to 
logic blocks farther away. The unlabeled triangles at 
selected intersections of horizontal and vertical lines 
25 allow programmable connections at the intersections. As 

discussed in connection with Fig. 4B, the combination of a 
triangle and an open circle with a line to its center 
indicates a bidirectional buffer with default input. In 
Fig. 4B or Figs. 7A-7C, the circle can be thought of as a 
30 programmable buffered connection to a RAM block above or 

below the figure. The triangle (with circle above) can be 
thought of as a programmable buffered connection into RAM 
531. 

35 niffprpnce BefwfiPP FmbodjmentS 

There is a basic difference between the embodiments 
of Fig. 2 and Figs. 7A-7C. In Fig. 2, data-out lines from 
several RAMs are connected to the same vertical data-out 
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lines, and in a deep configuration (1024x9 shown in Fig. 
6A for example) several RAM blocks may be connected to the 
same line. Contention is avoided by using the enable 
lines to avoid placing more than one signal onto a data- 
out line at one time. 

In the embodiment of Figs. 7A-7C, there are no enable 
lines. Contention is avoided by staggering the data-in 
and data-out lines. At the tops of Figs. 7A-7C, 
programmable connectors, such as DIC31 and DIC30 labeled 
in Fig. 7B, connect to lines extending into the RAM block 
above. Looking at Fig. 7B, data-in line DI30 connects 
through programmable data-in connector DIC30 to data-in 
line DI31', which continues as line DI31 in the RAM block 
above. Left-most line DI31 connects through programmable 
data-in connector DIC31 to line DI16', which continues as 
line DI16 in the RAM block above. Other lines are 
staggered by lines above their respective programmable 
connectors to move left in the RAM block above. The same 
staggering arrangement occurs for the data-out lines to 
the right of RAM 531. Looking at both Figs. 7A and 7B, 
one can see that the top line L3-23 (Fig. 7A) of lines L3 
can be programmably connected to vertical line DI31 and 
programmably connected through data-in PIP DIP31 (Fig. 7B) 
to data-in line DIB3 in RAM 531. Alternatively or 
additionally, the RAM above RAM 531 may be used by setting 
programmable connector DIC31 to conduct signals upward, 
thereby connecting line DI31 to line DI16', which 
continues as line DI16 in the RAM block above. Line DI16 
can be seen in Fig. 7B to connect through PIP DIP16 to 
data-in line DIB7. Thus line DI31 can connect to data-in 
line DIB3 in the RAM block shown or to line DIB7 in the 
RAM block above. 

Separation of staggered lines for maximum flex ibility in 
all RAM configurations 

Note the numbering of the data-in and data-out lines 
in Figs. 7B and 7C. The data-in and data-out lines in RAM 
531 are numbered according to which bit is most 
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significant, bit 7 being most significant and bit 0 being 
least significant. The numbering is not consecutive. (Of 
course the illustration could have been drawn with 
consecutive numbering and a correspondingly different 
5 pattern of PIPs external to RAM 531.) The PIPs and 

staggered vertical lines are arranged so that xl, x2, x4, 
and x8 RAM memories can all be accessed through the 
vertical lines with no contention over the largest 
possible span of vertically adjacent RAM blocks for the 

10 number of vertical data lines provided. For a xl RAM, 

that is, when RAM 531 has been configured with one bit in 
a data word, only the DO line is used (for example lines 
DIAO, DIBO, DOA0, and DOB0) and the vertical line which 
connects to a particular horizontal DO line does not 

15 connect to that same vertical line until 16 RAM blocks 

have passed. For a x2 RAM, that is, when RAM 531 has been 
configured with 2 bits in a data word, only lines DO and 
Dl are used. These are separated from each other by the 
staggering structure at the top of Figs. 7A-7C so that a 

20 DO line does not conflict with a Dl line until 8 RAM 

blocks have passed. Similarly, for a x4 RAM, lines DO, 
Dl, D2, and D3 are used and don't conflict until four RAM 
blocks have passed. Finally, for the x8 configuration, 
all the horizontal data lines are used. Since there are 8 

25 horizontal data lines and 16 vertical data lines, the 

configuration can be arranged so that even when eight data 
lines are used there is no conflict until 2 RAM blocks 
have passed. 

In the embodiment of Fig. 7A, a xl memory is assumed 
30 to use only the 0th data ports. However, in another 

embodiment, a RAM block in a xl memory configuration can 
place a single signal onto several or all data ports, and 
thereby increase the routing flexibility without 
increasing the space required for pipulation. Similarly, 
35 a x2 configuration can use more than two data ports and a 

x4 configuration can use more than four data ports. 



20 



WO 98/10517 PCT/US97/10279 

population 

Looking at Fig. 7A, a regular pattern of PIPs allows 
interconnect lines LO through L3 to access RAM block 531 
as well as other RAM blocks above and below the figure. 
5 Lines in sets LO through L3 can serve as address or data 

lines. For example, line L3-23 in set L3 can be used as 
an address line by turning on the PIP at the intersection 
of line L3-23 and vertical address line A23 . Vertical 
address line A23 can in turn access horizontal A-port 

10 address line ADAH or horizontal B-port address line ADB11 

by turning on the PIP at the intersection of those two 
lines. Vertical address line A23 can be connected to 
another vertical address line A23 in the RAM block above 
the figure by turning on connector AC23 at the top of the 

15 figure and this vertical address line can in turn be 

connected to horizontal address lines such as shown in 
Fig. 7A. Thus, line L3-23 can access many different 
horizontal address lines in many different RAM blocks. 
Each of the lines L3-0 through L3-23 in set L3 can access 

20 one of the horizontal address lines leading to RAM 531. 

The PIPs for connecting set L2 to vertical address 
bus ADDR are offset from corresponding PIPs for set L3 . 
PIPs for sets LI and LO are likewise offset. The four 
sets LO through L3 can each access all horizontal address 

25 lines ADA11-ADA0 in the A-port and all horizontal address 

lines ADB11-ADB0 in the B-port through vertical address 
bus ADDR, though different vertical address lines are used 
by the four sets of lines L0-L3 because the offset of PIPs 
is different for the four sets of lines L0-L3. For 

30 example, in set L3, line L3-23 can access horizontal 

address lines ADAH, ADA10, ADB4 and ADB5 . In set L2, 
line L2-23 can access the same horizontal address lines as 
line L3-23 but through vertical address line A22. Lines 
L2-23 and Ll-23 access horizontal address lines ADA10, 
35 ADA9, ADB4 and ADB3 through vertical address lines A21 and 

A20 respectively. 

Lines in sets L0-L3 can also serve as data-in or 
data-out lines. For example, line L3-23 in set L3 can be 
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used as a data-in line by turning on the PIP at the 
intersection of line L3-23 and vertical data-in line DI31 
and turning on one or more PIPs at the intersections of 
vertical data-in line DI31 and horizontal data-in lines 
5 DIB3 and DIA3 (see labeling in Fig. 7B) . 

Note that line L3-23 can not serve as a data-out line 
from the B-port of RAM 531 in Fig. 7A. Though a PIP is 
present at the intersection of line L3-23 and vertical 
data-out line D027, no PIP is present at the intersection 

10 of vertical data-out line D027 and any horizontal data-out 

lines from the B-port of RAM 531. However, line L3-23 can 
serve as a data-out line from the B-port of the 
corresponding RAM 531 above Fig. 7A. Turning on connector 
D0C31 (see Fig. 7C) connects vertical data-out line D031 

15 to data-out line D016', which continues as data-out line 

D016 in the RAM block above the figure. As can be seen in 
Fig. 7C, vertical data-out line D016 can receive data from 
horizontal data-out line DOB0 by turning on the PIP at 
that intersection. Other patterns of PIPs allow other 

20 options. As discussed above, a more dense pipulation 

gives more options but requires more chip area to 
implement . 

Dual -Port RAM Feature 

25 With the separate data-in and data-out lines, some 

logic blocks can read RAM 531 through port B while other 
logic blocks are writing to RAM 531 through port A. 
Notice that 24 vertical address lines A0-A23 are provided 
and that in a 4096-deep configuration 12 address lines are 

30 used. For example, if the odd-numbered ones of address 

lines A0-A23 are used for writing to data-in port A, then 
the even numbered address lines can be used for reading 
from data-out port B. (Any mixture of lines can be used 
for ports A and B as long as there are sufficient lines 

35 and sufficient PIPs.) 

For writing to port A and reading from port B in the 
4096x4 RAM, four data bits will be written to vertical 
data-in lines DIO through DI3 by turning on four pairs of 
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PIPs. One PIP will be turned on at the intersection of 
horizontal line L3-20 and vertical data-in line DI19, a 
second PIP at the intersection of horizontal line L2-20 
and vertical data-in line DI18, a third at the 
intersection of horizontal line Ll-2 0 and vertical data-in 
line DI17, and a fourth at the intersection of horizontal 
line LO-20 and vertical data-in line DI16. 

To complete the paths, PIP DIP19 in RAM 531 is turned 
on to connect line L3-20 to data-in port DIBO . Thus, the 
signal on line L3-20 is received on line DIAO in RAM 531, 
and written by well-known means to the addressed memory 
cell in RAM 531. PIP DIP18 is not turned on. Thus, the 
signal on line L2-20 is not connected to line DIAO in RAM 
531. However, in an identical RAM block above, PIP DIP19 
is turned on, thus the signal on line L2-12 is received on 
line DIAO in the RAM above RAM 531. The signal on line Ll- 
20 which is placed on vertical data-in line DI17 is 
connected by connector DIC17 to vertical data-in line DI18 
in the RAM block above Fig. 7A and further through a 
connector DIC18 in the RAM block above Fig. 7A to a 
vertical data-in line DI19 in the RAM block two above Fig. 
7A. From there it connects through a PIP DIP19 to a 
horizontal data-in line DIAO and into the RAM two above 
Fig. 7A. Similarly, the signal on line LO-20 which is 
placed on line DI16 in Fig. 7A is connected to a 
horizontal data-in line DIAO in the RAM block three above 
Fig. 7A. 

Thus four bits of a data word which are placed onto 
lines L3-20, L2-20, Ll-20, and LO-20 by logic blocks 
adjacent the RAM block of Fig. 7A are written into memory 
cells in four different RAM blocks, three of which are 
above Fig. 7A. 

In each of four RAM blocks, only horizontal data-out 
line DOB0 is used. This results in four data-out signals 
being placed onto vertical data-out lines D016 through 
D019 of Fig. 7C or Fig. 7A. Although PIPs are present at 
the intersections of these four lines and horizontal lines 
L3-20, L2-20, Ll-20, and LO-20, these four horizontal 
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lines can not be used for reading because they are already 
being used for the writing operation described above. 
However, PIPs are also present at intersections with lines 
L3-14, L2-14, Ll-14, and L0-14 and these lines can be used 
for writing by turning on the respective PIPs. 

Example Applications of RAM Block of Figs , 7A-7g 

RAM 531 is a dual-port RAM with four configurations. 
RAM 531 contains 4096 memory cells, which can be 
configured by well known internal structures as a 4096x1 
RAM, a 2048x2 RAM, a 1024x4 RAM or a 512x8 RAM. There are 
24 horizontal address lines, 12 for each port, in the 
embodiment of Fig. 7A. 

In a 4096x1 configuration, 12 horizontal address 
lines address each port (2 12 = 4096) . In the 4096x1 
configuration, only horizontal data-in lines DIA0 AND DIB0 
and horizontal data-out lineS DOAO and DOB0 are used. 

In a 2048x2 RAM configuration, 11 horizontal address 
lines address each port (2 11 = 2048), leaving the most 
significant address bit for each port unused. Two data-in 
lines for each port DIA0, DIA1, DIB0, and DIB1 and two 
data-out lines for each port DOAO, DOAl, DOBO and DOB1 are 
used. 

In a 512x8 RAM, nine address lines for each port, 
lines ADB8-ADB0 and ADA8-ADA0 are used for addressing. 
The three most significant address lines are ignored. In 
the 512x8 configuration, all 8 data lines for each port 
are used. 

Fig. 8A shows an example application of the 
embodiment of Figs. 7A-7C when the RAM blocks are in the 
512x8 configuration. Four RAM blocks are used in 
conjunction. They are configured as a 512x32 RAM. Since 
the logic that accesses the memory cells in the four 
adjacent RAM blocks has been placed so that each logic 
block accesses an adjacent RAM block, the vertical 
connections from one RAM block to the next are not needed 
or used. Fig. 8A shows the vertical data-out routing 
lines within one RAM block being used to carry signals 
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from RAM block output ports to logic block input ports. 

Memory cells in RAM block 531-8 store the least 
significant bits 0 through 7 of each 3 2 -bit word. The 
output ports DOB0 through DOB7 of RAM block 531-8 are 
connected to logic blocks in the four rows adjacent to RAM 
block 531-8 by turning on PIPs to the vertical data-out 
lines. For simplicity, only the PIP at the intersection 
of vertical data-out line DO-16 and one of the horizontal 
lines is labeled. In the example shown, data-out port 
DOB0 in RAM block 531-8 is connected to vertical data-out 
line DO-16 by turning on the PIP at the intersection of 
these two lines. By turning on the PIP at the 
intersection of vertical line DO-16 and horizontal line 
LO-5, data-out port DOB0 is connected to line LO-5 to 
provide the 0 data bit to logic block 25-40. Similarly, 
data-out port D0B1 is connected to vertical line DO-22, 
which is in turn connected to line LO-7 of logic block 25- 
40. The other 30 data bits of the 32-bit word are 
connected as shown. Additional connections not shown in 
Fig. 8A allow logic blocks to access vertical address 
lines and data-in lines as well as to apply clock and 
other required signals to implement the desired memory 
functions . 

Deepeir RAM? that Use Connections Be tween Vertical Lines 

With the dedicated vertical lines and PIP pattern 
shown, larger RAMs are conveniently formed by connecting 
the vertical address, data, and control lines together. 
Fig. 8B illustrates use of the programmable 
interconnections between vertical data-out lines in 
adjacent RAM blocks to implement a 2048x8 RAM memory in 
four adjacent RAM blocks. Fig. 8B also shows how the 
data-out lines are connected to the logic blocks for this 
configuration. Logic blocks 25-33 through 25-36 receive 
the eight bits 0 through 7 of a data word. These four 
logic blocks are adjacent RAM block 531-7. But some data 
bits are stored in RAM blocks that are not adjacent logic 
blocks 25-33 through 25-36. Thus the vertical lines are 
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used to conveniently make the transfer. For example, 
memory bit 2 provided to logic block 25-35 is stored in 
RAM block 531-8 and accessed through port DOB0 . Routing 
is connected by turning on the PIP at the intersection of 
DOB0 and DO-16 adjacent RAM block 531-8, turning on the 
PIP at the intersection of DO-17 and Ll-5 adjacent RAM 
block 531-7, and turning on tristate buffer TB-1, which 
connects vertical line DO-16 adjacent RAM block 531-8 to 
vertical line DO-17 adjacent RAM block 531-7. To supply 
bits 0 and 1 does not require that tristate buffers be 
used. To supply bits 2, 3, 6, and 7 requires that one 
tristate buffer be turned on for each bit. To supply bits 
4 and 5 requires that two tristate buffers be turned on 
for each bit. For example, bit 5, which is supplied on 
output port DOB1 of RAM block 531-5 is routed to its 
destination in logic block 25-34 by turning on tristate 
buffers TB2 and TB3 as well as the PIP at the intersection 
of D0B1 and DO-24 adjacent RAM block 531-5 and the PIP at 
the intersection of DO-22 and line L2-6 adjacent RAM block 
531-7. 

RAMs Using RAM Blocks an d Logic 

Additional flexibility in forming RAMs, especially 
large RAMs, is achieved by combining the logic and routing 
structures of the FPGA with the RAM blocks. 

Fig. 8C shows an 8192x2 RAM formed using two logic 
blocks for multiplexing signals and two additional logic 
blocks for routing signals. Fig. 8C shows the address and 
data-in lines as well as the data-out lines shown in Figs. 
8A and 8B. 

Since the embodiment of Fig. 7A uses 4096 memory 
cells in a RAM block, it takes 2 RAM blocks to store one 
bit of all words. In Fig. 8C, bit 0 is stored in RAM 
blocks 531-7 and 531-8 while bit 1 is stored in RAM blocks 
531-5 and 531-6. Port B has been selected to access the 
memory, for both reading and writing. Writing is to port 
DIBO and reading is from port DOB0. A memory 8192 cells 
deep requires 13 address lines. Port B has only 12 
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address lines. Therefore, twelve address signals AO 
through All are applied to the 12 address ports. Ten of 
the 12 address signals are applied by turning on one PIP 
between a logic block and a vertical address line and one 
PIP between a vertical address line and an address port. 
Two of the address signals A8 and All are applied to 
corresponding address ports by routing the address signal 
to an adjacent logic block and from there to a vertical 
address line and on to an address port. For example, 
address signal All is applied to local interconnect line 
II, and by turning on PIP9 to horizontal line L2-15, which 
is connected by turning on PIP10 to vertical interconnect 
line ADDR14. PIPs then connect this vertical interconnect 
line to address port ADB11 in each of RAM blocks 531-5 
through 531-8. 

The thirteenth address signal A12 is logically 
combined with the write enable signal DWE so that only the 
addressed memory cells are written. This logical 
combination can be done several ways. In Fig. 8C, logic 
blocks 24-31 and 24-32 do the logical combination of the 
write-enable and address signals. Logic block 24-31 
generates the AND function of DWE and A12 . The AND 
function output is applied to the write-enable ports WEB 
of RAM blocks 531-5 and 531-7 so that when DWE is high 
(data to be written) and A12 is high (the address is in 
the upper half of its range) , a write enable signal will 
be applied to RAM blocks 531-5 and 531-7. Logic block 

24- 32 generates the AND function of DWE and the inverse of 
A12 so that when an address in the lower half of its range 
is to be written, RAM blocks 531-6 and 531-8 are enabled. 

On the data-out side, logical combination with 
address signal A12 is performed in logic blocks 25-35 and 

25- 36, which are each configured as multiplexers. Data 
bit D01 is generated in logic block 25-35. Logic block 
25-35 receives the DOB0 output signals from RAM blocks 
531-6 and 531-8. When A12 is high, the multiplexer in 
logic block 25-35 selects the data bit from RAM block 531- 
6 and when A12 is low, the multiplexer in logic block 25- 
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35 selects the data bit from RAM block 531-8. A similar 
situation exists in logic block 25-36. Thus the 
multiplexer outputs from logic blocks 25-35 and 25-36 are 
the two bits DO0 and DOl of the addressed word in the 
5 8192 -deep memory. 

Note that when PIPs in the vertical lines of the RAM 
block were not available to connect an output signal from 
RAM block 531-5 to logic block 25-35, local interconnect, 
which is typically provided in FPGA logic blocks, carries 
10 the signal. In this example, data-out port DOB0 of RAM 

block 531-5 is connected to logic block 25-35 by turning 
on PIP1, TB5, TB4, PIP2, PIP3 . and PIP4 . Of these, PIP3 
and PIP4 are part of the logic block local interconnect 
structure such as found in conventional FPGAs. 
15 Address line A12 is routed to the multiplexer control 

lines of logic blocks 25-35 and 25-36 through general 
interconnect structure by turning on PIP5 through PIP8. 

Many routing lines and interconnect structures not 
shown in Fig. 8C but well known in the prior art would of 
20 course be provided in a commercial embodiment of an FPGA. 

Since showing such structures is believed to obscure the 
understanding of the present invention, they have not been 
shown here. 

> 

25 Larger RAMs 

It is possible to form a 4096x16 RAM by joining 
together 16 RAM blocks in a vertical column before there 
will be any contention on the vertical address, data-in, 
and data-out lines. Larger memories can be formed by 
30 segmenting RAM blocks in the same vertical column, by 

using RAM blocks from more than one column, or by using 
vertical general interconnect (well known in FPGA 
architectures) for interconnecting or accessing portions 
of the RAM. As shown in Fig. 1A, an FPGA chip typically 
35 includes multiple columns of RAM blocks. Horizontal lines 

such as L0-L3 can be used to access more than one column 
of RAM blocks. Wider RAMs are formed by connecting 
together more RAM blocks in a vertical column. 
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Other Rifoofl^eEits 

The embodiment of Fig. 7A shows 24 address lines, and 
16 data-in and data-out lines for each port. Thus 16 
5 vertically adjacent RAM blocks can conveniently be 

combined, that is, used in combination without producing 
contention on data-out lines or ambiguity on input lines . 
Other numbers of lines, other patterns of PIPs, and other 
sizes of RAMs can of course be used. 
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CLAIMS 

1. An FPGA with RAM comprising: 

a plurality of logic blocks arranged in rows and 
columns ; 

a plurality of RAM blocks arranged in columns, said 

RAM blocks having address ports and data ports; 
an interconnect structure comprising conductive lines 

arranged in rows; 
a set of vertical lines, each set associated with a 

column of said RAM blocks; 
means for connecting said logic blocks to said 

interconnect structure; 
means for connecting said vertical lines to said 

interconnect structure; and 
means for connecting said address and data ports to 

said vertical lines. 

2. An FPGA with RAM as in Claim 1 further comprising: 

means for segmenting said vertical lines. 

3 . An FPGA with RAM as in Claim 2 wherein some of said 
means for segmenting are bidirectional buffers. 

4. An FPGA with RAM as in Claim 2 wherein some of said 
means for segmenting are pass transistors. 

5 . An FPGA with RAM as in Claim 3 wherein said 
bidirectional buffers segment a line into line segments, 
each segment being adjacent to a RAM block. 

6 . An FPGA with RAM as in Claim 1 wherein some of said RAM 
blocks comprises dual port RAMs having two address ports 
and at least two data ports, all ports being accessible by 
said vertical lines. 
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7 . An FPGA with RAM as in Claim 1 wherein each of said RAM 
blocks can be configured to a plurality of length-to-width 
ratios. 

5 8. An FPGA with RAM as in Claim 1 wherein each of said RAM 

blocks spans four logic blocks. 

9. An FPGA with RAM as in Claim 2 wherein a first one of 
said RAM blocks is connectable to different ones of said 

10 conductive lines from a second one of said RAM blocks 

vertically adjacent to said first RAM block. 

10. An FPGA with RAM as in Claim 9 wherein a vertical line 
in said first RAM block can be connected to a different 

15 vertical line in said second RAM block such that a signal 

from a given port in said first RAM block does not 
conflict with a signal from the same given port in said 
second RAM block. 

11. An FPGA with RAM blocks comprising: 
a plurality of logic blocks arranged in rows and 

columns ; 

a plurality of general interconnect lines [L0-L3]; 
a plurality of RAM blocks [13] each comprising: 

a plurality of RAMs [131], each being addressed 
by an address bus [ADDRA, ADDRB] and 
accessed by at least one data bus [DINA, 
DINB, DOUTA, DOUTB] , and being enabled by 
at least one enable line [WEA, WEB, ENA, 
ENB] ; and 

means [PIPs] for connecting each line in each of 
said address bus and said data bus to at 
least one of said general interconnect 
lines; and 

means for programmably connecting each enable line, 
each line in each of said address bus and said 
at least one data bus in one of said RAM blocks 
to a corresponding line in another of said RAM 
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blocks, whereby a larger RAM is formed having a 
programmable configuration; 
said data bus in one of said RAM blocks being 

connected to a data bus in another of said RAM 
blocks through a tristatable bidirectional 
connector . 

12. An FPGA as in Claim 11 in which said means for 
programmably connecting each enable line, each line in 
each of said address bus and said at least one data bus in 
one of said RAM blocks to a corresponding line in another 
of said RAM blocks comprises a bidirectional buffer for 
making each programmable connection. 

13 . An FPGA as in Claim 11 in which said means for 
programmably connecting each enable line, each line in 
each of said address bus and said at least one data bus in 
one of said RAM blocks to a corresponding line in another 
of said RAM blocks comprises a pass gate for making each 
programmable connection. 

14. An FPGA as in Claim 11 in which said means for 
programmably connecting each enable line, each line in 
each of said address bus and said at least one data bus in 
one of said RAM blocks to a corresponding line in another 
of said RAM blocks comprises at least one bidirectional 
buffer for making a corresponding at least one 
programmable connection, and at least one pass transistor 
for making a corresponding at least one programmable 
connection. 

15. An FPGA as in Claim 14 in which said at least one 
bidirectional buffer comprises bidirectional buffers for 
connecting all lines which provide input signals to one of 
said RAMs and said at least one pass transistor comprises 
pass transistors for connecting all lines which provide 
output from one of said RAMs. 



32 



WOW/10517 



PCT/US97/10279 



16. An FPGA as in Claim 11 in which said at least one 
enable line is a plurality of enable lines providing input 
signals to a decoder [132] . 

17. An FPGA as in Claim 16 in which said decoder 
comprises: 

a plurality of multiplexers [MUX0-MUX3] each 

controlled by one of said enable lines, said 
multiplexers each receiving a plurality of 
multiplexer input signals having a selectable 
value . 

18. An FPGA as in Claim 17 in which said multiplexer 
input signals are each stored in a memory cell. 
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AMENDED CLAIMS 

[received by the International Bureau on 30 December 1997 (30.12.97); 
original claims 1,6 and 9-11 amended; remaining claims unchanged 

(4 pages)] 

1. An FPGA with RAM comprising: 

a plurality of logic blocks arranged in rows and 
columns ; 

a plurality of RAM blocks dedicated to the RAM 

function and arranged in columns, said RAM 

blocks having address ports and data ports; 
an interconnect structure comprising conductive lines 

arranged in rows; 
a set of vertical lines, each set programmably 

driving said address ports of a column of more 

than one of said RAM blocks; 
means for connecting said logic blocks to said 

interconnect structure; 
means for connecting said vertical lines to said 

interconnect structure; and 
means for connecting said address ports to said 

vertical lines. 

2. An FPGA with RAM as in Claim 1 further comprising: 

means for segmenting said vertical lines. 

3. An FPGA with RAM as in Claim 2 wherein some of said 
means for segmenting are bidirectional buffers. 

4. An FPGA with RAM as in Claim 2 wherein some of said 
means for segmenting are pass transistors. 

5. An FPGA with RAM as in Claim 3 wherein said 
bidirectional buffers segment a line into line segments, 
each segment being adjacent to a RAM block. 

6. An FPGA with RAM as in Claim 1 wherein some of said RAM 
blocks comprise dual port RAMs having two address ports 
and at least two data ports, all such address ports being 
accessible by said vertical lines. 
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7 . An FPGA with RAM as in Claim 1 wherein each of said RAM 
blocks can be configured to a plurality of length-to-width 
ratios. 

8. An FPGA with RAM as in Claim 1 wherein each of said RAM 
blocks spans four logic blocks. 

9. An FPGA with RAM as in Claim 2, further comprising: 

a group of data lines running vertically, each group 
programmably driving said data ports of a column 
of more than one of said RAM blocks; 
means for connecting said data lines to said 

interconnect structure; 
means for connecting said data ports to said data 

lines; and 
means for segmenting said data lines; 
wherein a first one of said RAM blocks is connectable 
to different ones of said data lines from a second one of 
said RAM blocks vertically adjacent to said first RAM 
block. 

10. An FPGA with RAM as in Claim 9 wherein a first one of 
said group of data lines driving said first RAM block can 
be connected without utilizing said interconnect structure 
to a different one of said group of data lines driving 
said second RAM block such that a signal driving a given 
data port in said first RAM block does not conflict with a 
signal driving the same given data port in said second RAM 
block . 

11. An FPGA with RAM blocks comprising: 

a plurality of logic blocks arranged in rows and 
columns; 

a plurality of general interconnect lines [L0-L3]; 
a plurality of RAM blocks [13] each comprising: 

a plurality of RAMs [131] dedicated to the RAM 
function, each being addressed by an 
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address bus [ADDRA, ADDRB] and accessed by 
at least one data bus [DINA, DINB, DOUTA, 
DOUTB] , and being enabled by at least one 
enable line [WEA, WEB, ENA, ENB] ; and 
means [PIPs] for connecting each line in each of 
said address bus and said data bus to at 
least one of said general interconnect 
lines; and 

means for programmably connecting each enable line, 
each line in each of said address bus and said 
at least one data bus in one of said RAM blocks 
to a corresponding line in another of said RAM 
blocks, whereby a larger RAM is formed having a 
programmable configuration; 

said data bus in one of said RAM blocks being 

connected to a data bus in another of said RAM 
blocks through a tristatable bidirectional 
connector. 

12. An FPGA as in Claim 11 in which said means for 
programmably connecting each enable line, each line in 
each of said address bus and said at least one data bus in 
one of said RAM blocks to a corresponding line in another 
of said RAM blocks comprises a bidirectional buffer for 
making each programmable connection. 

13. An FPGA as in Claim 11 in which said means for 
programmably connecting each enable line, each line in 
each of said address bus and said at least one data bus in 
one of said RAM blocks to a corresponding line in another 
of said RAM blocks comprises a pass gate for making each 
programmable connection. 

14. An FPGA as in Claim 11 in which said means for 
programmably connecting each enable line, each line in 
each of said address bus and said at least one data bus in 
one of said RAM blocks to a corresponding line in another 
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of said RAM blocks comprises at least one bidirectional 
buffer for making a corresponding at least one 
programmable connection, and at least one pass transistor 
for making a corresponding at least one programmable 
5 connection. 

15. An FPGA as in Claim 14 in which said at least one 
bidirectional buffer comprises bidirectional buffers for 
connecting all lines which provide input signals to one of 

10 said RAMs and said at least one pass transistor comprises 

pass transistors for connecting all lines which provide 
output from one of said RAMs. 

16. An FPGA as in Claim 11 in which said at least one 

15 enable line is a plurality of enable lines providing input 

signals to a decoder [132]. 

17. An FPGA as in Claim 16 in which said decoder 
comprises : 

20 a plurality of multiplexers [MUX0-MUX3] each 

controlled by one of said enable lines, said 
multiplexers each receiving a plurality of 
multiplexer input signals having a selectable 
value . 

25 

18. An FPGA as in Claim 17 in which said multiplexer 
input signals are each stored in a memory cell. 
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